EuroCD 3

home *** CD-ROM | disk | FTP | other *** search

/ EuroCD 3 / EuroCD 3.iso / Programming / vbcc / machines / amiga68k / libsrc / math / math_040 / M68060SP / fplsp.s < prev

Wrap

Text File | 1998-06-24 | 287.0 KB | 10,981 lines

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ MOTOROLA MICROPROCESSOR & MEMORY TECHNOLOGY GROUP M68000 Hi-Performance Microprocessor Division M68060 Software Package Production Release P1.00 -- October 10, 1994 M68060 Software Package Copyright © 1993, 1994 Motorola Inc. All rights reserved. THE SOFTWARE is provided on an "AS IS" basis and without warranty. To the maximum extent permitted by applicable law, MOTOROLA DISCLAIMS ALL WARRANTIES WHETHER EXPRESS OR IMPLIED, INCLUDING IMPLIED WARRANTIES OF MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE and any warranty against infringement with regard to the SOFTWARE (INCLUDING ANY MODIFIED VERSIONS THEREOF) and any accompanying written materials. To the maximum extent permitted by applicable law, IN NO EVENT SHALL MOTOROLA BE LIABLE FOR ANY DAMAGES WHATSOEVER (INCLUDING WITHOUT LIMITATION, DAMAGES FOR LOSS OF BUSINESS PROFITS, BUSINESS INTERRUPTION, LOSS OF BUSINESS INFORMATION, OR OTHER PECUNIARY LOSS) ARISING OF THE USE OR INABILITY TO USE THE SOFTWARE. Motorola assumes no responsibility for the maintenance and support of the SOFTWARE. You are hereby granted a copyright license to use, modify, and distribute the SOFTWARE so long as this entire notice is retained without alteration in any modified and/or redistributed versions, and that such modified versions are clearly identified as such. No licenses are granted by implication, estoppel or otherwise under any patents or trademarks of Motorola, Inc. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ # # lfptop.s: # This file is appended to the top of the 060ILSP package # and contains the entry points into the package. The user, in # effect, branches to one of the branch table entries located here. # bra.l _facoss_ short 0x0000 bra.l _facosd_ short 0x0000 bra.l _facosx_ short 0x0000 bra.l _fasins_ short 0x0000 bra.l _fasind_ short 0x0000 bra.l _fasinx_ short 0x0000 bra.l _fatans_ short 0x0000 bra.l _fatand_ short 0x0000 bra.l _fatanx_ short 0x0000 bra.l _fatanhs_ short 0x0000 bra.l _fatanhd_ short 0x0000 bra.l _fatanhx_ short 0x0000 bra.l _fcoss_ short 0x0000 bra.l _fcosd_ short 0x0000 bra.l _fcosx_ short 0x0000 bra.l _fcoshs_ short 0x0000 bra.l _fcoshd_ short 0x0000 bra.l _fcoshx_ short 0x0000 bra.l _fetoxs_ short 0x0000 bra.l _fetoxd_ short 0x0000 bra.l _fetoxx_ short 0x0000 bra.l _fetoxm1s_ short 0x0000 bra.l _fetoxm1d_ short 0x0000 bra.l _fetoxm1x_ short 0x0000 bra.l _fgetexps_ short 0x0000 bra.l _fgetexpd_ short 0x0000 bra.l _fgetexpx_ short 0x0000 bra.l _fgetmans_ short 0x0000 bra.l _fgetmand_ short 0x0000 bra.l _fgetmanx_ short 0x0000 bra.l _flog10s_ short 0x0000 bra.l _flog10d_ short 0x0000 bra.l _flog10x_ short 0x0000 bra.l _flog2s_ short 0x0000 bra.l _flog2d_ short 0x0000 bra.l _flog2x_ short 0x0000 bra.l _flogns_ short 0x0000 bra.l _flognd_ short 0x0000 bra.l _flognx_ short 0x0000 bra.l _flognp1s_ short 0x0000 bra.l _flognp1d_ short 0x0000 bra.l _flognp1x_ short 0x0000 bra.l _fmods_ short 0x0000 bra.l _fmodd_ short 0x0000 bra.l _fmodx_ short 0x0000 bra.l _frems_ short 0x0000 bra.l _fremd_ short 0x0000 bra.l _fremx_ short 0x0000 bra.l _fscales_ short 0x0000 bra.l _fscaled_ short 0x0000 bra.l _fscalex_ short 0x0000 bra.l _fsins_ short 0x0000 bra.l _fsind_ short 0x0000 bra.l _fsinx_ short 0x0000 bra.l _fsincoss_ short 0x0000 bra.l _fsincosd_ short 0x0000 bra.l _fsincosx_ short 0x0000 bra.l _fsinhs_ short 0x0000 bra.l _fsinhd_ short 0x0000 bra.l _fsinhx_ short 0x0000 bra.l _ftans_ short 0x0000 bra.l _ftand_ short 0x0000 bra.l _ftanx_ short 0x0000 bra.l _ftanhs_ short 0x0000 bra.l _ftanhd_ short 0x0000 bra.l _ftanhx_ short 0x0000 bra.l _ftentoxs_ short 0x0000 bra.l _ftentoxd_ short 0x0000 bra.l _ftentoxx_ short 0x0000 bra.l _ftwotoxs_ short 0x0000 bra.l _ftwotoxd_ short 0x0000 bra.l _ftwotoxx_ short 0x0000 bra.l _fabss_ short 0x0000 bra.l _fabsd_ short 0x0000 bra.l _fabsx_ short 0x0000 bra.l _fadds_ short 0x0000 bra.l _faddd_ short 0x0000 bra.l _faddx_ short 0x0000 bra.l _fdivs_ short 0x0000 bra.l _fdivd_ short 0x0000 bra.l _fdivx_ short 0x0000 bra.l _fints_ short 0x0000 bra.l _fintd_ short 0x0000 bra.l _fintx_ short 0x0000 bra.l _fintrzs_ short 0x0000 bra.l _fintrzd_ short 0x0000 bra.l _fintrzx_ short 0x0000 bra.l _fmuls_ short 0x0000 bra.l _fmuld_ short 0x0000 bra.l _fmulx_ short 0x0000 bra.l _fnegs_ short 0x0000 bra.l _fnegd_ short 0x0000 bra.l _fnegx_ short 0x0000 bra.l _fsqrts_ short 0x0000 bra.l _fsqrtd_ short 0x0000 bra.l _fsqrtx_ short 0x0000 bra.l _fsubs_ short 0x0000 bra.l _fsubd_ short 0x0000 bra.l _fsubx_ short 0x0000 # leave room for future possible additions align 0x400 # # This file contains a set of define statements for constants # in order to promote readability within the corecode itself. # set LOCAL_SIZE, 192 # stack frame size(bytes) set LV, -LOCAL_SIZE # stack offset set EXC_SR, 0x4 # stack status register set EXC_PC, 0x6 # stack pc set EXC_VOFF, 0xa # stacked vector offset set EXC_EA, 0xc # stacked <ea> set EXC_FP, 0x0 # frame pointer set EXC_AREGS, -68 # offset of all address regs set EXC_DREGS, -100 # offset of all data regs set EXC_FPREGS, -36 # offset of all fp regs set EXC_A7, EXC_AREGS+(7*4) # offset of saved a7 set OLD_A7, EXC_AREGS+(6*4) # extra copy of saved a7 set EXC_A6, EXC_AREGS+(6*4) # offset of saved a6 set EXC_A5, EXC_AREGS+(5*4) set EXC_A4, EXC_AREGS+(4*4) set EXC_A3, EXC_AREGS+(3*4) set EXC_A2, EXC_AREGS+(2*4) set EXC_A1, EXC_AREGS+(1*4) set EXC_A0, EXC_AREGS+(0*4) set EXC_D7, EXC_DREGS+(7*4) set EXC_D6, EXC_DREGS+(6*4) set EXC_D5, EXC_DREGS+(5*4) set EXC_D4, EXC_DREGS+(4*4) set EXC_D3, EXC_DREGS+(3*4) set EXC_D2, EXC_DREGS+(2*4) set EXC_D1, EXC_DREGS+(1*4) set EXC_D0, EXC_DREGS+(0*4) set EXC_FP0, EXC_FPREGS+(0*12) # offset of saved fp0 set EXC_FP1, EXC_FPREGS+(1*12) # offset of saved fp1 set EXC_FP2, EXC_FPREGS+(2*12) # offset of saved fp2 (not used) set FP_SCR1, LV+80 # fp scratch 1 set FP_SCR1_EX, FP_SCR1+0 set FP_SCR1_SGN, FP_SCR1+2 set FP_SCR1_HI, FP_SCR1+4 set FP_SCR1_LO, FP_SCR1+8 set FP_SCR0, LV+68 # fp scratch 0 set FP_SCR0_EX, FP_SCR0+0 set FP_SCR0_SGN, FP_SCR0+2 set FP_SCR0_HI, FP_SCR0+4 set FP_SCR0_LO, FP_SCR0+8 set FP_DST, LV+56 # fp destination operand set FP_DST_EX, FP_DST+0 set FP_DST_SGN, FP_DST+2 set FP_DST_HI, FP_DST+4 set FP_DST_LO, FP_DST+8 set FP_SRC, LV+44 # fp source operand set FP_SRC_EX, FP_SRC+0 set FP_SRC_SGN, FP_SRC+2 set FP_SRC_HI, FP_SRC+4 set FP_SRC_LO, FP_SRC+8 set USER_FPIAR, LV+40 # FP instr address register set USER_FPSR, LV+36 # FP status register set FPSR_CC, USER_FPSR+0 # FPSR condition codes set FPSR_QBYTE, USER_FPSR+1 # FPSR qoutient byte set FPSR_EXCEPT, USER_FPSR+2 # FPSR exception status byte set FPSR_AEXCEPT, USER_FPSR+3 # FPSR accrued exception byte set USER_FPCR, LV+32 # FP control register set FPCR_ENABLE, USER_FPCR+2 # FPCR exception enable set FPCR_MODE, USER_FPCR+3 # FPCR rounding mode control set L_SCR3, LV+28 # integer scratch 3 set L_SCR2, LV+24 # integer scratch 2 set L_SCR1, LV+20 # integer scratch 1 set STORE_FLG, LV+19 # flag: operand store (ie. not fcmp/ftst) set EXC_TEMP2, LV+24 # temporary space set EXC_TEMP, LV+16 # temporary space set DTAG, LV+15 # destination operand type set STAG, LV+14 # source operand type set SPCOND_FLG, LV+10 # flag: special case (see below) set EXC_CC, LV+8 # saved condition codes set EXC_EXTWPTR, LV+4 # saved current PC (active) set EXC_EXTWORD, LV+2 # saved extension word set EXC_CMDREG, LV+2 # saved extension word set EXC_OPWORD, LV+0 # saved operation word ################################ # Helpful macros set FTEMP, 0 # offsets within an set FTEMP_EX, 0 # extended precision set FTEMP_SGN, 2 # value saved in memory. set FTEMP_HI, 4 set FTEMP_LO, 8 set FTEMP_GRS, 12 set LOCAL, 0 # offsets within an set LOCAL_EX, 0 # extended precision set LOCAL_SGN, 2 # value saved in memory. set LOCAL_HI, 4 set LOCAL_LO, 8 set LOCAL_GRS, 12 set DST, 0 # offsets within an set DST_EX, 0 # extended precision set DST_HI, 4 # value saved in memory. set DST_LO, 8 set SRC, 0 # offsets within an set SRC_EX, 0 # extended precision set SRC_HI, 4 # value saved in memory. set SRC_LO, 8 set SGL_LO, 0x3f81 # min sgl prec exponent set SGL_HI, 0x407e # max sgl prec exponent set DBL_LO, 0x3c01 # min dbl prec exponent set DBL_HI, 0x43fe # max dbl prec exponent set EXT_LO, 0x0 # min ext prec exponent set EXT_HI, 0x7ffe # max ext prec exponent set EXT_BIAS, 0x3fff # extended precision bias set SGL_BIAS, 0x007f # single precision bias set DBL_BIAS, 0x03ff # double precision bias set NORM, 0x00 # operand type for STAG/DTAG set ZERO, 0x01 # operand type for STAG/DTAG set INF, 0x02 # operand type for STAG/DTAG set QNAN, 0x03 # operand type for STAG/DTAG set DENORM, 0x04 # operand type for STAG/DTAG set SNAN, 0x05 # operand type for STAG/DTAG set UNNORM, 0x06 # operand type for STAG/DTAG ################## # FPSR/FPCR bits # ################## set neg_bit, 0x3 # negative result set z_bit, 0x2 # zero result set inf_bit, 0x1 # infinite result set nan_bit, 0x0 # NAN result set q_sn_bit, 0x7 # sign bit of quotient byte set bsun_bit, 7 # branch on unordered set snan_bit, 6 # signalling NAN set operr_bit, 5 # operand error set ovfl_bit, 4 # overflow set unfl_bit, 3 # underflow set dz_bit, 2 # divide by zero set inex2_bit, 1 # inexact result 2 set inex1_bit, 0 # inexact result 1 set aiop_bit, 7 # accrued inexact operation bit set aovfl_bit, 6 # accrued overflow bit set aunfl_bit, 5 # accrued underflow bit set adz_bit, 4 # accrued dz bit set ainex_bit, 3 # accrued inexact bit ############################# # FPSR individual bit masks # ############################# set neg_mask, 0x08000000 # negative bit mask (lw) set inf_mask, 0x02000000 # infinity bit mask (lw) set z_mask, 0x04000000 # zero bit mask (lw) set nan_mask, 0x01000000 # nan bit mask (lw) set neg_bmask, 0x08 # negative bit mask (byte) set inf_bmask, 0x02 # infinity bit mask (byte) set z_bmask, 0x04 # zero bit mask (byte) set nan_bmask, 0x01 # nan bit mask (byte) set bsun_mask, 0x00008000 # bsun exception mask set snan_mask, 0x00004000 # snan exception mask set operr_mask, 0x00002000 # operr exception mask set ovfl_mask, 0x00001000 # overflow exception mask set unfl_mask, 0x00000800 # underflow exception mask set dz_mask, 0x00000400 # dz exception mask set inex2_mask, 0x00000200 # inex2 exception mask set inex1_mask, 0x00000100 # inex1 exception mask set aiop_mask, 0x00000080 # accrued illegal operation set aovfl_mask, 0x00000040 # accrued overflow set aunfl_mask, 0x00000020 # accrued underflow set adz_mask, 0x00000010 # accrued divide by zero set ainex_mask, 0x00000008 # accrued inexact ###################################### # FPSR combinations used in the FPSP # ###################################### set dzinf_mask, inf_mask+dz_mask+adz_mask set opnan_mask, nan_mask+operr_mask+aiop_mask set nzi_mask, 0x01ffffff #clears N, Z, and I set unfinx_mask, unfl_mask+inex2_mask+aunfl_mask+ainex_mask set unf2inx_mask, unfl_mask+inex2_mask+ainex_mask set ovfinx_mask, ovfl_mask+inex2_mask+aovfl_mask+ainex_mask set inx1a_mask, inex1_mask+ainex_mask set inx2a_mask, inex2_mask+ainex_mask set snaniop_mask, nan_mask+snan_mask+aiop_mask set snaniop2_mask, snan_mask+aiop_mask set naniop_mask, nan_mask+aiop_mask set neginf_mask, neg_mask+inf_mask set infaiop_mask, inf_mask+aiop_mask set negz_mask, neg_mask+z_mask set opaop_mask, operr_mask+aiop_mask set unfl_inx_mask, unfl_mask+aunfl_mask+ainex_mask set ovfl_inx_mask, ovfl_mask+aovfl_mask+ainex_mask ######### # misc. # ######### set rnd_stky_bit, 29 # stky bit pos in longword set sign_bit, 0x7 # sign bit set signan_bit, 0x6 # signalling nan bit set sgl_thresh, 0x3f81 # minimum sgl exponent set dbl_thresh, 0x3c01 # minimum dbl exponent set x_mode, 0x0 # extended precision set s_mode, 0x4 # single precision set d_mode, 0x8 # double precision set rn_mode, 0x0 # round-to-nearest set rz_mode, 0x1 # round-to-zero set rm_mode, 0x2 # round-tp-minus-infinity set rp_mode, 0x3 # round-to-plus-infinity set mantissalen, 64 # length of mantissa in bits set BYTE, 1 # len(byte) == 1 byte set WORD, 2 # len(word) == 2 bytes set LONG, 4 # len(longword) == 2 bytes set BSUN_VEC, 0xc0 # bsun vector offset set INEX_VEC, 0xc4 # inexact vector offset set DZ_VEC, 0xc8 # dz vector offset set UNFL_VEC, 0xcc # unfl vector offset set OPERR_VEC, 0xd0 # operr vector offset set OVFL_VEC, 0xd4 # ovfl vector offset set SNAN_VEC, 0xd8 # snan vector offset ########################### # SPecial CONDition FLaGs # ########################### set ftrapcc_flg, 0x01 # flag bit: ftrapcc exception set fbsun_flg, 0x02 # flag bit: bsun exception set mia7_flg, 0x04 # flag bit: (a7)+ <ea> set mda7_flg, 0x08 # flag bit: -(a7) <ea> set fmovm_flg, 0x40 # flag bit: fmovm instruction set immed_flg, 0x80 # flag bit: &<data> <ea> set ftrapcc_bit, 0x0 set fbsun_bit, 0x1 set mia7_bit, 0x2 set mda7_bit, 0x3 set immed_bit, 0x7 ################################## # TRANSCENDENTAL "LAST-OP" FLAGS # ################################## set FMUL_OP, 0x0 # fmul instr performed last set FDIV_OP, 0x1 # fdiv performed last set FADD_OP, 0x2 # fadd performed last set FMOV_OP, 0x3 # fmov performed last ############# # CONSTANTS # ############# T1: long 0x40C62D38,0xD3D64634 # 16381 LOG2 LEAD T2: long 0x3D6F90AE,0xB1E75CC7 # 16381 LOG2 TRAIL PI: long 0x40000000,0xC90FDAA2,0x2168C235,0x00000000 PIBY2: long 0x3FFF0000,0xC90FDAA2,0x2168C235,0x00000000 TWOBYPI: long 0x3FE45F30,0x6DC9C883 ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _fsins_ _fsins_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L0_2s bsr.l ssin # operand is a NORM bra.b _L0_6s _L0_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L0_3s # no bsr.l src_zero # yes bra.b _L0_6s _L0_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L0_4s # no bsr.l t_operr # yes bra.b _L0_6s _L0_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L0_5s # no bsr.l src_qnan # yes bra.b _L0_6s _L0_5s: bsr.l ssind # operand is a DENORM _L0_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fsind_ _fsind_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L0_2d bsr.l ssin # operand is a NORM bra.b _L0_6d _L0_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L0_3d # no bsr.l src_zero # yes bra.b _L0_6d _L0_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L0_4d # no bsr.l t_operr # yes bra.b _L0_6d _L0_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L0_5d # no bsr.l src_qnan # yes bra.b _L0_6d _L0_5d: bsr.l ssind # operand is a DENORM _L0_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fsinx_ _fsinx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L0_2x bsr.l ssin # operand is a NORM bra.b _L0_6x _L0_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L0_3x # no bsr.l src_zero # yes bra.b _L0_6x _L0_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L0_4x # no bsr.l t_operr # yes bra.b _L0_6x _L0_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L0_5x # no bsr.l src_qnan # yes bra.b _L0_6x _L0_5x: bsr.l ssind # operand is a DENORM _L0_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _fcoss_ _fcoss_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L1_2s bsr.l scos # operand is a NORM bra.b _L1_6s _L1_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L1_3s # no bsr.l ld_pone # yes bra.b _L1_6s _L1_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L1_4s # no bsr.l t_operr # yes bra.b _L1_6s _L1_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L1_5s # no bsr.l src_qnan # yes bra.b _L1_6s _L1_5s: bsr.l scosd # operand is a DENORM _L1_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fcosd_ _fcosd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L1_2d bsr.l scos # operand is a NORM bra.b _L1_6d _L1_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L1_3d # no bsr.l ld_pone # yes bra.b _L1_6d _L1_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L1_4d # no bsr.l t_operr # yes bra.b _L1_6d _L1_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L1_5d # no bsr.l src_qnan # yes bra.b _L1_6d _L1_5d: bsr.l scosd # operand is a DENORM _L1_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fcosx_ _fcosx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L1_2x bsr.l scos # operand is a NORM bra.b _L1_6x _L1_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L1_3x # no bsr.l ld_pone # yes bra.b _L1_6x _L1_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L1_4x # no bsr.l t_operr # yes bra.b _L1_6x _L1_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L1_5x # no bsr.l src_qnan # yes bra.b _L1_6x _L1_5x: bsr.l scosd # operand is a DENORM _L1_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _fsinhs_ _fsinhs_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L2_2s bsr.l ssinh # operand is a NORM bra.b _L2_6s _L2_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L2_3s # no bsr.l src_zero # yes bra.b _L2_6s _L2_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L2_4s # no bsr.l src_inf # yes bra.b _L2_6s _L2_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L2_5s # no bsr.l src_qnan # yes bra.b _L2_6s _L2_5s: bsr.l ssinhd # operand is a DENORM _L2_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fsinhd_ _fsinhd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L2_2d bsr.l ssinh # operand is a NORM bra.b _L2_6d _L2_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L2_3d # no bsr.l src_zero # yes bra.b _L2_6d _L2_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L2_4d # no bsr.l src_inf # yes bra.b _L2_6d _L2_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L2_5d # no bsr.l src_qnan # yes bra.b _L2_6d _L2_5d: bsr.l ssinhd # operand is a DENORM _L2_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fsinhx_ _fsinhx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L2_2x bsr.l ssinh # operand is a NORM bra.b _L2_6x _L2_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L2_3x # no bsr.l src_zero # yes bra.b _L2_6x _L2_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L2_4x # no bsr.l src_inf # yes bra.b _L2_6x _L2_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L2_5x # no bsr.l src_qnan # yes bra.b _L2_6x _L2_5x: bsr.l ssinhd # operand is a DENORM _L2_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _flognp1s_ _flognp1s_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L3_2s bsr.l slognp1 # operand is a NORM bra.b _L3_6s _L3_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L3_3s # no bsr.l src_zero # yes bra.b _L3_6s _L3_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L3_4s # no bsr.l sopr_inf # yes bra.b _L3_6s _L3_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L3_5s # no bsr.l src_qnan # yes bra.b _L3_6s _L3_5s: bsr.l slognp1d # operand is a DENORM _L3_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _flognp1d_ _flognp1d_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L3_2d bsr.l slognp1 # operand is a NORM bra.b _L3_6d _L3_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L3_3d # no bsr.l src_zero # yes bra.b _L3_6d _L3_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L3_4d # no bsr.l sopr_inf # yes bra.b _L3_6d _L3_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L3_5d # no bsr.l src_qnan # yes bra.b _L3_6d _L3_5d: bsr.l slognp1d # operand is a DENORM _L3_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _flognp1x_ _flognp1x_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L3_2x bsr.l slognp1 # operand is a NORM bra.b _L3_6x _L3_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L3_3x # no bsr.l src_zero # yes bra.b _L3_6x _L3_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L3_4x # no bsr.l sopr_inf # yes bra.b _L3_6x _L3_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L3_5x # no bsr.l src_qnan # yes bra.b _L3_6x _L3_5x: bsr.l slognp1d # operand is a DENORM _L3_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _fetoxm1s_ _fetoxm1s_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L4_2s bsr.l setoxm1 # operand is a NORM bra.b _L4_6s _L4_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L4_3s # no bsr.l src_zero # yes bra.b _L4_6s _L4_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L4_4s # no bsr.l setoxm1i # yes bra.b _L4_6s _L4_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L4_5s # no bsr.l src_qnan # yes bra.b _L4_6s _L4_5s: bsr.l setoxm1d # operand is a DENORM _L4_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fetoxm1d_ _fetoxm1d_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L4_2d bsr.l setoxm1 # operand is a NORM bra.b _L4_6d _L4_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L4_3d # no bsr.l src_zero # yes bra.b _L4_6d _L4_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L4_4d # no bsr.l setoxm1i # yes bra.b _L4_6d _L4_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L4_5d # no bsr.l src_qnan # yes bra.b _L4_6d _L4_5d: bsr.l setoxm1d # operand is a DENORM _L4_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fetoxm1x_ _fetoxm1x_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L4_2x bsr.l setoxm1 # operand is a NORM bra.b _L4_6x _L4_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L4_3x # no bsr.l src_zero # yes bra.b _L4_6x _L4_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L4_4x # no bsr.l setoxm1i # yes bra.b _L4_6x _L4_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L4_5x # no bsr.l src_qnan # yes bra.b _L4_6x _L4_5x: bsr.l setoxm1d # operand is a DENORM _L4_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _ftanhs_ _ftanhs_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L5_2s bsr.l stanh # operand is a NORM bra.b _L5_6s _L5_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L5_3s # no bsr.l src_zero # yes bra.b _L5_6s _L5_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L5_4s # no bsr.l src_one # yes bra.b _L5_6s _L5_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L5_5s # no bsr.l src_qnan # yes bra.b _L5_6s _L5_5s: bsr.l stanhd # operand is a DENORM _L5_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _ftanhd_ _ftanhd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L5_2d bsr.l stanh # operand is a NORM bra.b _L5_6d _L5_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L5_3d # no bsr.l src_zero # yes bra.b _L5_6d _L5_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L5_4d # no bsr.l src_one # yes bra.b _L5_6d _L5_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L5_5d # no bsr.l src_qnan # yes bra.b _L5_6d _L5_5d: bsr.l stanhd # operand is a DENORM _L5_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _ftanhx_ _ftanhx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L5_2x bsr.l stanh # operand is a NORM bra.b _L5_6x _L5_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L5_3x # no bsr.l src_zero # yes bra.b _L5_6x _L5_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L5_4x # no bsr.l src_one # yes bra.b _L5_6x _L5_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L5_5x # no bsr.l src_qnan # yes bra.b _L5_6x _L5_5x: bsr.l stanhd # operand is a DENORM _L5_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _fatans_ _fatans_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L6_2s bsr.l satan # operand is a NORM bra.b _L6_6s _L6_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L6_3s # no bsr.l src_zero # yes bra.b _L6_6s _L6_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L6_4s # no bsr.l spi_2 # yes bra.b _L6_6s _L6_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L6_5s # no bsr.l src_qnan # yes bra.b _L6_6s _L6_5s: bsr.l satand # operand is a DENORM _L6_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fatand_ _fatand_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L6_2d bsr.l satan # operand is a NORM bra.b _L6_6d _L6_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L6_3d # no bsr.l src_zero # yes bra.b _L6_6d _L6_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L6_4d # no bsr.l spi_2 # yes bra.b _L6_6d _L6_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L6_5d # no bsr.l src_qnan # yes bra.b _L6_6d _L6_5d: bsr.l satand # operand is a DENORM _L6_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fatanx_ _fatanx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L6_2x bsr.l satan # operand is a NORM bra.b _L6_6x _L6_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L6_3x # no bsr.l src_zero # yes bra.b _L6_6x _L6_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L6_4x # no bsr.l spi_2 # yes bra.b _L6_6x _L6_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L6_5x # no bsr.l src_qnan # yes bra.b _L6_6x _L6_5x: bsr.l satand # operand is a DENORM _L6_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _fasins_ _fasins_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L7_2s bsr.l sasin # operand is a NORM bra.b _L7_6s _L7_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L7_3s # no bsr.l src_zero # yes bra.b _L7_6s _L7_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L7_4s # no bsr.l t_operr # yes bra.b _L7_6s _L7_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L7_5s # no bsr.l src_qnan # yes bra.b _L7_6s _L7_5s: bsr.l sasind # operand is a DENORM _L7_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fasind_ _fasind_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L7_2d bsr.l sasin # operand is a NORM bra.b _L7_6d _L7_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L7_3d # no bsr.l src_zero # yes bra.b _L7_6d _L7_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L7_4d # no bsr.l t_operr # yes bra.b _L7_6d _L7_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L7_5d # no bsr.l src_qnan # yes bra.b _L7_6d _L7_5d: bsr.l sasind # operand is a DENORM _L7_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fasinx_ _fasinx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L7_2x bsr.l sasin # operand is a NORM bra.b _L7_6x _L7_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L7_3x # no bsr.l src_zero # yes bra.b _L7_6x _L7_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L7_4x # no bsr.l t_operr # yes bra.b _L7_6x _L7_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L7_5x # no bsr.l src_qnan # yes bra.b _L7_6x _L7_5x: bsr.l sasind # operand is a DENORM _L7_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _fatanhs_ _fatanhs_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L8_2s bsr.l satanh # operand is a NORM bra.b _L8_6s _L8_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L8_3s # no bsr.l src_zero # yes bra.b _L8_6s _L8_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L8_4s # no bsr.l t_operr # yes bra.b _L8_6s _L8_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L8_5s # no bsr.l src_qnan # yes bra.b _L8_6s _L8_5s: bsr.l satanhd # operand is a DENORM _L8_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fatanhd_ _fatanhd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L8_2d bsr.l satanh # operand is a NORM bra.b _L8_6d _L8_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L8_3d # no bsr.l src_zero # yes bra.b _L8_6d _L8_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L8_4d # no bsr.l t_operr # yes bra.b _L8_6d _L8_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L8_5d # no bsr.l src_qnan # yes bra.b _L8_6d _L8_5d: bsr.l satanhd # operand is a DENORM _L8_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fatanhx_ _fatanhx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L8_2x bsr.l satanh # operand is a NORM bra.b _L8_6x _L8_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L8_3x # no bsr.l src_zero # yes bra.b _L8_6x _L8_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L8_4x # no bsr.l t_operr # yes bra.b _L8_6x _L8_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L8_5x # no bsr.l src_qnan # yes bra.b _L8_6x _L8_5x: bsr.l satanhd # operand is a DENORM _L8_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _ftans_ _ftans_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L9_2s bsr.l stan # operand is a NORM bra.b _L9_6s _L9_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L9_3s # no bsr.l src_zero # yes bra.b _L9_6s _L9_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L9_4s # no bsr.l t_operr # yes bra.b _L9_6s _L9_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L9_5s # no bsr.l src_qnan # yes bra.b _L9_6s _L9_5s: bsr.l stand # operand is a DENORM _L9_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _ftand_ _ftand_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L9_2d bsr.l stan # operand is a NORM bra.b _L9_6d _L9_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L9_3d # no bsr.l src_zero # yes bra.b _L9_6d _L9_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L9_4d # no bsr.l t_operr # yes bra.b _L9_6d _L9_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L9_5d # no bsr.l src_qnan # yes bra.b _L9_6d _L9_5d: bsr.l stand # operand is a DENORM _L9_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _ftanx_ _ftanx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L9_2x bsr.l stan # operand is a NORM bra.b _L9_6x _L9_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L9_3x # no bsr.l src_zero # yes bra.b _L9_6x _L9_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L9_4x # no bsr.l t_operr # yes bra.b _L9_6x _L9_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L9_5x # no bsr.l src_qnan # yes bra.b _L9_6x _L9_5x: bsr.l stand # operand is a DENORM _L9_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _fetoxs_ _fetoxs_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L10_2s bsr.l setox # operand is a NORM bra.b _L10_6s _L10_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L10_3s # no bsr.l ld_pone # yes bra.b _L10_6s _L10_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L10_4s # no bsr.l szr_inf # yes bra.b _L10_6s _L10_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L10_5s # no bsr.l src_qnan # yes bra.b _L10_6s _L10_5s: bsr.l setoxd # operand is a DENORM _L10_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fetoxd_ _fetoxd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L10_2d bsr.l setox # operand is a NORM bra.b _L10_6d _L10_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L10_3d # no bsr.l ld_pone # yes bra.b _L10_6d _L10_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L10_4d # no bsr.l szr_inf # yes bra.b _L10_6d _L10_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L10_5d # no bsr.l src_qnan # yes bra.b _L10_6d _L10_5d: bsr.l setoxd # operand is a DENORM _L10_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fetoxx_ _fetoxx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L10_2x bsr.l setox # operand is a NORM bra.b _L10_6x _L10_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L10_3x # no bsr.l ld_pone # yes bra.b _L10_6x _L10_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L10_4x # no bsr.l szr_inf # yes bra.b _L10_6x _L10_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L10_5x # no bsr.l src_qnan # yes bra.b _L10_6x _L10_5x: bsr.l setoxd # operand is a DENORM _L10_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _ftwotoxs_ _ftwotoxs_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L11_2s bsr.l stwotox # operand is a NORM bra.b _L11_6s _L11_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L11_3s # no bsr.l ld_pone # yes bra.b _L11_6s _L11_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L11_4s # no bsr.l szr_inf # yes bra.b _L11_6s _L11_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L11_5s # no bsr.l src_qnan # yes bra.b _L11_6s _L11_5s: bsr.l stwotoxd # operand is a DENORM _L11_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _ftwotoxd_ _ftwotoxd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L11_2d bsr.l stwotox # operand is a NORM bra.b _L11_6d _L11_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L11_3d # no bsr.l ld_pone # yes bra.b _L11_6d _L11_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L11_4d # no bsr.l szr_inf # yes bra.b _L11_6d _L11_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L11_5d # no bsr.l src_qnan # yes bra.b _L11_6d _L11_5d: bsr.l stwotoxd # operand is a DENORM _L11_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _ftwotoxx_ _ftwotoxx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L11_2x bsr.l stwotox # operand is a NORM bra.b _L11_6x _L11_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L11_3x # no bsr.l ld_pone # yes bra.b _L11_6x _L11_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L11_4x # no bsr.l szr_inf # yes bra.b _L11_6x _L11_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L11_5x # no bsr.l src_qnan # yes bra.b _L11_6x _L11_5x: bsr.l stwotoxd # operand is a DENORM _L11_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _ftentoxs_ _ftentoxs_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L12_2s bsr.l stentox # operand is a NORM bra.b _L12_6s _L12_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L12_3s # no bsr.l ld_pone # yes bra.b _L12_6s _L12_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L12_4s # no bsr.l szr_inf # yes bra.b _L12_6s _L12_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L12_5s # no bsr.l src_qnan # yes bra.b _L12_6s _L12_5s: bsr.l stentoxd # operand is a DENORM _L12_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _ftentoxd_ _ftentoxd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L12_2d bsr.l stentox # operand is a NORM bra.b _L12_6d _L12_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L12_3d # no bsr.l ld_pone # yes bra.b _L12_6d _L12_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L12_4d # no bsr.l szr_inf # yes bra.b _L12_6d _L12_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L12_5d # no bsr.l src_qnan # yes bra.b _L12_6d _L12_5d: bsr.l stentoxd # operand is a DENORM _L12_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _ftentoxx_ _ftentoxx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L12_2x bsr.l stentox # operand is a NORM bra.b _L12_6x _L12_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L12_3x # no bsr.l ld_pone # yes bra.b _L12_6x _L12_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L12_4x # no bsr.l szr_inf # yes bra.b _L12_6x _L12_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L12_5x # no bsr.l src_qnan # yes bra.b _L12_6x _L12_5x: bsr.l stentoxd # operand is a DENORM _L12_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _flogns_ _flogns_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L13_2s bsr.l slogn # operand is a NORM bra.b _L13_6s _L13_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L13_3s # no bsr.l t_dz2 # yes bra.b _L13_6s _L13_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L13_4s # no bsr.l sopr_inf # yes bra.b _L13_6s _L13_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L13_5s # no bsr.l src_qnan # yes bra.b _L13_6s _L13_5s: bsr.l slognd # operand is a DENORM _L13_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _flognd_ _flognd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L13_2d bsr.l slogn # operand is a NORM bra.b _L13_6d _L13_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L13_3d # no bsr.l t_dz2 # yes bra.b _L13_6d _L13_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L13_4d # no bsr.l sopr_inf # yes bra.b _L13_6d _L13_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L13_5d # no bsr.l src_qnan # yes bra.b _L13_6d _L13_5d: bsr.l slognd # operand is a DENORM _L13_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _flognx_ _flognx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L13_2x bsr.l slogn # operand is a NORM bra.b _L13_6x _L13_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L13_3x # no bsr.l t_dz2 # yes bra.b _L13_6x _L13_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L13_4x # no bsr.l sopr_inf # yes bra.b _L13_6x _L13_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L13_5x # no bsr.l src_qnan # yes bra.b _L13_6x _L13_5x: bsr.l slognd # operand is a DENORM _L13_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _flog10s_ _flog10s_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L14_2s bsr.l slog10 # operand is a NORM bra.b _L14_6s _L14_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L14_3s # no bsr.l t_dz2 # yes bra.b _L14_6s _L14_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L14_4s # no bsr.l sopr_inf # yes bra.b _L14_6s _L14_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L14_5s # no bsr.l src_qnan # yes bra.b _L14_6s _L14_5s: bsr.l slog10d # operand is a DENORM _L14_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _flog10d_ _flog10d_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L14_2d bsr.l slog10 # operand is a NORM bra.b _L14_6d _L14_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L14_3d # no bsr.l t_dz2 # yes bra.b _L14_6d _L14_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L14_4d # no bsr.l sopr_inf # yes bra.b _L14_6d _L14_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L14_5d # no bsr.l src_qnan # yes bra.b _L14_6d _L14_5d: bsr.l slog10d # operand is a DENORM _L14_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _flog10x_ _flog10x_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L14_2x bsr.l slog10 # operand is a NORM bra.b _L14_6x _L14_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L14_3x # no bsr.l t_dz2 # yes bra.b _L14_6x _L14_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L14_4x # no bsr.l sopr_inf # yes bra.b _L14_6x _L14_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L14_5x # no bsr.l src_qnan # yes bra.b _L14_6x _L14_5x: bsr.l slog10d # operand is a DENORM _L14_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _flog2s_ _flog2s_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L15_2s bsr.l slog2 # operand is a NORM bra.b _L15_6s _L15_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L15_3s # no bsr.l t_dz2 # yes bra.b _L15_6s _L15_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L15_4s # no bsr.l sopr_inf # yes bra.b _L15_6s _L15_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L15_5s # no bsr.l src_qnan # yes bra.b _L15_6s _L15_5s: bsr.l slog2d # operand is a DENORM _L15_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _flog2d_ _flog2d_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L15_2d bsr.l slog2 # operand is a NORM bra.b _L15_6d _L15_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L15_3d # no bsr.l t_dz2 # yes bra.b _L15_6d _L15_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L15_4d # no bsr.l sopr_inf # yes bra.b _L15_6d _L15_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L15_5d # no bsr.l src_qnan # yes bra.b _L15_6d _L15_5d: bsr.l slog2d # operand is a DENORM _L15_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _flog2x_ _flog2x_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L15_2x bsr.l slog2 # operand is a NORM bra.b _L15_6x _L15_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L15_3x # no bsr.l t_dz2 # yes bra.b _L15_6x _L15_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L15_4x # no bsr.l sopr_inf # yes bra.b _L15_6x _L15_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L15_5x # no bsr.l src_qnan # yes bra.b _L15_6x _L15_5x: bsr.l slog2d # operand is a DENORM _L15_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _fcoshs_ _fcoshs_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L16_2s bsr.l scosh # operand is a NORM bra.b _L16_6s _L16_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L16_3s # no bsr.l ld_pone # yes bra.b _L16_6s _L16_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L16_4s # no bsr.l ld_pinf # yes bra.b _L16_6s _L16_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L16_5s # no bsr.l src_qnan # yes bra.b _L16_6s _L16_5s: bsr.l scoshd # operand is a DENORM _L16_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fcoshd_ _fcoshd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L16_2d bsr.l scosh # operand is a NORM bra.b _L16_6d _L16_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L16_3d # no bsr.l ld_pone # yes bra.b _L16_6d _L16_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L16_4d # no bsr.l ld_pinf # yes bra.b _L16_6d _L16_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L16_5d # no bsr.l src_qnan # yes bra.b _L16_6d _L16_5d: bsr.l scoshd # operand is a DENORM _L16_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fcoshx_ _fcoshx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L16_2x bsr.l scosh # operand is a NORM bra.b _L16_6x _L16_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L16_3x # no bsr.l ld_pone # yes bra.b _L16_6x _L16_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L16_4x # no bsr.l ld_pinf # yes bra.b _L16_6x _L16_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L16_5x # no bsr.l src_qnan # yes bra.b _L16_6x _L16_5x: bsr.l scoshd # operand is a DENORM _L16_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _facoss_ _facoss_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L17_2s bsr.l sacos # operand is a NORM bra.b _L17_6s _L17_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L17_3s # no bsr.l ld_ppi2 # yes bra.b _L17_6s _L17_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L17_4s # no bsr.l t_operr # yes bra.b _L17_6s _L17_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L17_5s # no bsr.l src_qnan # yes bra.b _L17_6s _L17_5s: bsr.l sacosd # operand is a DENORM _L17_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _facosd_ _facosd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L17_2d bsr.l sacos # operand is a NORM bra.b _L17_6d _L17_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L17_3d # no bsr.l ld_ppi2 # yes bra.b _L17_6d _L17_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L17_4d # no bsr.l t_operr # yes bra.b _L17_6d _L17_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L17_5d # no bsr.l src_qnan # yes bra.b _L17_6d _L17_5d: bsr.l sacosd # operand is a DENORM _L17_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _facosx_ _facosx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L17_2x bsr.l sacos # operand is a NORM bra.b _L17_6x _L17_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L17_3x # no bsr.l ld_ppi2 # yes bra.b _L17_6x _L17_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L17_4x # no bsr.l t_operr # yes bra.b _L17_6x _L17_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L17_5x # no bsr.l src_qnan # yes bra.b _L17_6x _L17_5x: bsr.l sacosd # operand is a DENORM _L17_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _fgetexps_ _fgetexps_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L18_2s bsr.l sgetexp # operand is a NORM bra.b _L18_6s _L18_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L18_3s # no bsr.l src_zero # yes bra.b _L18_6s _L18_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L18_4s # no bsr.l t_operr # yes bra.b _L18_6s _L18_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L18_5s # no bsr.l src_qnan # yes bra.b _L18_6s _L18_5s: bsr.l sgetexpd # operand is a DENORM _L18_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fgetexpd_ _fgetexpd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L18_2d bsr.l sgetexp # operand is a NORM bra.b _L18_6d _L18_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L18_3d # no bsr.l src_zero # yes bra.b _L18_6d _L18_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L18_4d # no bsr.l t_operr # yes bra.b _L18_6d _L18_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L18_5d # no bsr.l src_qnan # yes bra.b _L18_6d _L18_5d: bsr.l sgetexpd # operand is a DENORM _L18_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fgetexpx_ _fgetexpx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L18_2x bsr.l sgetexp # operand is a NORM bra.b _L18_6x _L18_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L18_3x # no bsr.l src_zero # yes bra.b _L18_6x _L18_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L18_4x # no bsr.l t_operr # yes bra.b _L18_6x _L18_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L18_5x # no bsr.l src_qnan # yes bra.b _L18_6x _L18_5x: bsr.l sgetexpd # operand is a DENORM _L18_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _fgetmans_ _fgetmans_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L19_2s bsr.l sgetman # operand is a NORM bra.b _L19_6s _L19_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L19_3s # no bsr.l src_zero # yes bra.b _L19_6s _L19_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L19_4s # no bsr.l t_operr # yes bra.b _L19_6s _L19_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L19_5s # no bsr.l src_qnan # yes bra.b _L19_6s _L19_5s: bsr.l sgetmand # operand is a DENORM _L19_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fgetmand_ _fgetmand_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L19_2d bsr.l sgetman # operand is a NORM bra.b _L19_6d _L19_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L19_3d # no bsr.l src_zero # yes bra.b _L19_6d _L19_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L19_4d # no bsr.l t_operr # yes bra.b _L19_6d _L19_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L19_5d # no bsr.l src_qnan # yes bra.b _L19_6d _L19_5d: bsr.l sgetmand # operand is a DENORM _L19_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fgetmanx_ _fgetmanx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L19_2x bsr.l sgetman # operand is a NORM bra.b _L19_6x _L19_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L19_3x # no bsr.l src_zero # yes bra.b _L19_6x _L19_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L19_4x # no bsr.l t_operr # yes bra.b _L19_6x _L19_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L19_5x # no bsr.l src_qnan # yes bra.b _L19_6x _L19_5x: bsr.l sgetmand # operand is a DENORM _L19_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # MONADIC TEMPLATE # ######################################################################### global _fsincoss_ _fsincoss_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L20_2s bsr.l ssincos # operand is a NORM bra.b _L20_6s _L20_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L20_3s # no bsr.l ssincosz # yes bra.b _L20_6s _L20_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L20_4s # no bsr.l ssincosi # yes bra.b _L20_6s _L20_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L20_5s # no bsr.l ssincosqnan # yes bra.b _L20_6s _L20_5s: bsr.l ssincosd # operand is a DENORM _L20_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x &0x03,-(%sp) # store off fp0/fp1 fmovm.x (%sp)+,&0x40 # fp0 now in fp1 fmovm.x (%sp)+,&0x80 # fp1 now in fp0 unlk %a6 rts global _fsincosd_ _fsincosd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl input fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec mov.b %d1,STAG(%a6) tst.b %d1 bne.b _L20_2d bsr.l ssincos # operand is a NORM bra.b _L20_6d _L20_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L20_3d # no bsr.l ssincosz # yes bra.b _L20_6d _L20_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L20_4d # no bsr.l ssincosi # yes bra.b _L20_6d _L20_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L20_5d # no bsr.l ssincosqnan # yes bra.b _L20_6d _L20_5d: bsr.l ssincosd # operand is a DENORM _L20_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x &0x03,-(%sp) # store off fp0/fp1 fmovm.x (%sp)+,&0x40 # fp0 now in fp1 fmovm.x (%sp)+,&0x80 # fp1 now in fp0 unlk %a6 rts global _fsincosx_ _fsincosx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_SRC(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext input mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.b %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec tst.b %d1 bne.b _L20_2x bsr.l ssincos # operand is a NORM bra.b _L20_6x _L20_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L20_3x # no bsr.l ssincosz # yes bra.b _L20_6x _L20_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L20_4x # no bsr.l ssincosi # yes bra.b _L20_6x _L20_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L20_5x # no bsr.l ssincosqnan # yes bra.b _L20_6x _L20_5x: bsr.l ssincosd # operand is a DENORM _L20_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x &0x03,-(%sp) # store off fp0/fp1 fmovm.x (%sp)+,&0x40 # fp0 now in fp1 fmovm.x (%sp)+,&0x80 # fp1 now in fp0 unlk %a6 rts ######################################################################### # DYADIC TEMPLATE # ######################################################################### global _frems_ _frems_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl dst fmov.x %fp0,FP_DST(%a6) lea FP_DST(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,DTAG(%a6) fmov.s 0xc(%a6),%fp0 # load sgl src fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.l %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec lea FP_SRC(%a6),%a0 # pass ptr to src lea FP_DST(%a6),%a1 # pass ptr to dst tst.b %d1 bne.b _L21_2s bsr.l srem_snorm # operand is a NORM bra.b _L21_6s _L21_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L21_3s # no bsr.l srem_szero # yes bra.b _L21_6s _L21_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L21_4s # no bsr.l srem_sinf # yes bra.b _L21_6s _L21_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L21_5s # no bsr.l sop_sqnan # yes bra.b _L21_6s _L21_5s: bsr.l srem_sdnrm # operand is a DENORM _L21_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fremd_ _fremd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl dst fmov.x %fp0,FP_DST(%a6) lea FP_DST(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,DTAG(%a6) fmov.d 0x10(%a6),%fp0 # load dbl src fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.l %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec lea FP_SRC(%a6),%a0 # pass ptr to src lea FP_DST(%a6),%a1 # pass ptr to dst tst.b %d1 bne.b _L21_2d bsr.l srem_snorm # operand is a NORM bra.b _L21_6d _L21_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L21_3d # no bsr.l srem_szero # yes bra.b _L21_6d _L21_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L21_4d # no bsr.l srem_sinf # yes bra.b _L21_6d _L21_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L21_5d # no bsr.l sop_sqnan # yes bra.b _L21_6d _L21_5d: bsr.l srem_sdnrm # operand is a DENORM _L21_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fremx_ _fremx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_DST(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext dst mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,DTAG(%a6) lea FP_SRC(%a6),%a0 mov.l 0x14+0x0(%a6),0x0(%a0) # load ext src mov.l 0x14+0x4(%a6),0x4(%a0) mov.l 0x14+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.l %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec lea FP_SRC(%a6),%a0 # pass ptr to src lea FP_DST(%a6),%a1 # pass ptr to dst tst.b %d1 bne.b _L21_2x bsr.l srem_snorm # operand is a NORM bra.b _L21_6x _L21_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L21_3x # no bsr.l srem_szero # yes bra.b _L21_6x _L21_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L21_4x # no bsr.l srem_sinf # yes bra.b _L21_6x _L21_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L21_5x # no bsr.l sop_sqnan # yes bra.b _L21_6x _L21_5x: bsr.l srem_sdnrm # operand is a DENORM _L21_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # DYADIC TEMPLATE # ######################################################################### global _fmods_ _fmods_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl dst fmov.x %fp0,FP_DST(%a6) lea FP_DST(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,DTAG(%a6) fmov.s 0xc(%a6),%fp0 # load sgl src fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.l %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec lea FP_SRC(%a6),%a0 # pass ptr to src lea FP_DST(%a6),%a1 # pass ptr to dst tst.b %d1 bne.b _L22_2s bsr.l smod_snorm # operand is a NORM bra.b _L22_6s _L22_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L22_3s # no bsr.l smod_szero # yes bra.b _L22_6s _L22_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L22_4s # no bsr.l smod_sinf # yes bra.b _L22_6s _L22_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L22_5s # no bsr.l sop_sqnan # yes bra.b _L22_6s _L22_5s: bsr.l smod_sdnrm # operand is a DENORM _L22_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fmodd_ _fmodd_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl dst fmov.x %fp0,FP_DST(%a6) lea FP_DST(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,DTAG(%a6) fmov.d 0x10(%a6),%fp0 # load dbl src fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.l %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec lea FP_SRC(%a6),%a0 # pass ptr to src lea FP_DST(%a6),%a1 # pass ptr to dst tst.b %d1 bne.b _L22_2d bsr.l smod_snorm # operand is a NORM bra.b _L22_6d _L22_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L22_3d # no bsr.l smod_szero # yes bra.b _L22_6d _L22_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L22_4d # no bsr.l smod_sinf # yes bra.b _L22_6d _L22_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L22_5d # no bsr.l sop_sqnan # yes bra.b _L22_6d _L22_5d: bsr.l smod_sdnrm # operand is a DENORM _L22_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fmodx_ _fmodx_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_DST(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext dst mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,DTAG(%a6) lea FP_SRC(%a6),%a0 mov.l 0x14+0x0(%a6),0x0(%a0) # load ext src mov.l 0x14+0x4(%a6),0x4(%a0) mov.l 0x14+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.l %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec lea FP_SRC(%a6),%a0 # pass ptr to src lea FP_DST(%a6),%a1 # pass ptr to dst tst.b %d1 bne.b _L22_2x bsr.l smod_snorm # operand is a NORM bra.b _L22_6x _L22_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L22_3x # no bsr.l smod_szero # yes bra.b _L22_6x _L22_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L22_4x # no bsr.l smod_sinf # yes bra.b _L22_6x _L22_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L22_5x # no bsr.l sop_sqnan # yes bra.b _L22_6x _L22_5x: bsr.l smod_sdnrm # operand is a DENORM _L22_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # DYADIC TEMPLATE # ######################################################################### global _fscales_ _fscales_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.s 0x8(%a6),%fp0 # load sgl dst fmov.x %fp0,FP_DST(%a6) lea FP_DST(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,DTAG(%a6) fmov.s 0xc(%a6),%fp0 # load sgl src fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.l %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec lea FP_SRC(%a6),%a0 # pass ptr to src lea FP_DST(%a6),%a1 # pass ptr to dst tst.b %d1 bne.b _L23_2s bsr.l sscale_snorm # operand is a NORM bra.b _L23_6s _L23_2s: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L23_3s # no bsr.l sscale_szero # yes bra.b _L23_6s _L23_3s: cmpi.b %d1,&INF # is operand an INF? bne.b _L23_4s # no bsr.l sscale_sinf # yes bra.b _L23_6s _L23_4s: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L23_5s # no bsr.l sop_sqnan # yes bra.b _L23_6s _L23_5s: bsr.l sscale_sdnrm # operand is a DENORM _L23_6s: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fscaled_ _fscaled_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # fmov.d 0x8(%a6),%fp0 # load dbl dst fmov.x %fp0,FP_DST(%a6) lea FP_DST(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,DTAG(%a6) fmov.d 0x10(%a6),%fp0 # load dbl src fmov.x %fp0,FP_SRC(%a6) lea FP_SRC(%a6),%a0 bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.l %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec lea FP_SRC(%a6),%a0 # pass ptr to src lea FP_DST(%a6),%a1 # pass ptr to dst tst.b %d1 bne.b _L23_2d bsr.l sscale_snorm # operand is a NORM bra.b _L23_6d _L23_2d: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L23_3d # no bsr.l sscale_szero # yes bra.b _L23_6d _L23_3d: cmpi.b %d1,&INF # is operand an INF? bne.b _L23_4d # no bsr.l sscale_sinf # yes bra.b _L23_6d _L23_4d: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L23_5d # no bsr.l sop_sqnan # yes bra.b _L23_6d _L23_5d: bsr.l sscale_sdnrm # operand is a DENORM _L23_6d: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts global _fscalex_ _fscalex_: link %a6,&-LOCAL_SIZE movm.l &0x0303,EXC_DREGS(%a6) # save d0-d1/a0-a1 fmovm.l %fpcr,%fpsr,USER_FPCR(%a6) # save ctrl regs fmovm.x &0xc0,EXC_FP0(%a6) # save fp0/fp1 fmov.l &0x0,%fpcr # zero FPCR # # copy, convert, and tag input argument # lea FP_DST(%a6),%a0 mov.l 0x8+0x0(%a6),0x0(%a0) # load ext dst mov.l 0x8+0x4(%a6),0x4(%a0) mov.l 0x8+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,DTAG(%a6) lea FP_SRC(%a6),%a0 mov.l 0x14+0x0(%a6),0x0(%a0) # load ext src mov.l 0x14+0x4(%a6),0x4(%a0) mov.l 0x14+0x8(%a6),0x8(%a0) bsr.l tag # fetch operand type mov.b %d0,STAG(%a6) mov.l %d0,%d1 andi.l &0x00ff00ff,USER_FPSR(%a6) clr.l %d0 mov.b FPCR_MODE(%a6),%d0 # pass rnd mode,prec lea FP_SRC(%a6),%a0 # pass ptr to src lea FP_DST(%a6),%a1 # pass ptr to dst tst.b %d1 bne.b _L23_2x bsr.l sscale_snorm # operand is a NORM bra.b _L23_6x _L23_2x: cmpi.b %d1,&ZERO # is operand a ZERO? bne.b _L23_3x # no bsr.l sscale_szero # yes bra.b _L23_6x _L23_3x: cmpi.b %d1,&INF # is operand an INF? bne.b _L23_4x # no bsr.l sscale_sinf # yes bra.b _L23_6x _L23_4x: cmpi.b %d1,&QNAN # is operand a QNAN? bne.b _L23_5x # no bsr.l sop_sqnan # yes bra.b _L23_6x _L23_5x: bsr.l sscale_sdnrm # operand is a DENORM _L23_6x: # # Result is now in FP0 # movm.l EXC_DREGS(%a6),&0x0303 # restore d0-d1/a0-a1 fmovm.l USER_FPCR(%a6),%fpcr,%fpsr # restore ctrl regs fmovm.x EXC_FP1(%a6),&0x40 # restore fp1 unlk %a6 rts ######################################################################### # ssin(): computes the sine of a normalized input # # ssind(): computes the sine of a denormalized input # # scos(): computes the cosine of a normalized input # # scosd(): computes the cosine of a denormalized input # # ssincos(): computes the sine and cosine of a normalized input # # ssincosd(): computes the sine and cosine of a denormalized input # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # d0 = round precision,mode # # # # OUTPUT ************************************************************** # # fp0 = sin(X) or cos(X) # # # # For ssincos(X): # # fp0 = sin(X) # # fp1 = cos(X) # # # # ACCURACY and MONOTONICITY ******************************************* # # The returned result is within 1 ulp in 64 significant bit, i.e. # # within 0.5001 ulp to 53 bits if the result is subsequently # # rounded to double precision. The result is provably monotonic # # in double precision. # # # # ALGORITHM *********************************************************** # # # # SIN and COS: # # 1. If SIN is invoked, set AdjN := 0; otherwise, set AdjN := 1. # # # # 2. If |X| >= 15Pi or |X| < 2**(-40), go to 7. # # # # 3. Decompose X as X = N(Pi/2) + r where |r| <= Pi/4. Let # # k = N mod 4, so in particular, k = 0,1,2,or 3. # # Overwrite k by k := k + AdjN. # # # # 4. If k is even, go to 6. # # # # 5. (k is odd) Set j := (k-1)/2, sgn := (-1)**j. # # Return sgn*cos(r) where cos(r) is approximated by an # # even polynomial in r, 1 + r*r*(B1+s*(B2+ ... + s*B8)), # # s = r*r. # # Exit. # # # # 6. (k is even) Set j := k/2, sgn := (-1)**j. Return sgn*sin(r) # # where sin(r) is approximated by an odd polynomial in r # # r + r*s*(A1+s*(A2+ ... + s*A7)), s = r*r. # # Exit. # # # # 7. If |X| > 1, go to 9. # # # # 8. (|X|<2**(-40)) If SIN is invoked, return X; # # otherwise return 1. # # # # 9. Overwrite X by X := X rem 2Pi. Now that |X| <= Pi, # # go back to 3. # # # # SINCOS: # # 1. If |X| >= 15Pi or |X| < 2**(-40), go to 6. # # # # 2. Decompose X as X = N(Pi/2) + r where |r| <= Pi/4. Let # # k = N mod 4, so in particular, k = 0,1,2,or 3. # # # # 3. If k is even, go to 5. # # # # 4. (k is odd) Set j1 := (k-1)/2, j2 := j1 (EOR) (k mod 2), ie. # # j1 exclusive or with the l.s.b. of k. # # sgn1 := (-1)**j1, sgn2 := (-1)**j2. # # SIN(X) = sgn1 * cos(r) and COS(X) = sgn2*sin(r) where # # sin(r) and cos(r) are computed as odd and even # # polynomials in r, respectively. Exit # # # # 5. (k is even) Set j1 := k/2, sgn1 := (-1)**j1. # # SIN(X) = sgn1 * sin(r) and COS(X) = sgn1*cos(r) where # # sin(r) and cos(r) are computed as odd and even # # polynomials in r, respectively. Exit # # # # 6. If |X| > 1, go to 8. # # # # 7. (|X|<2**(-40)) SIN(X) = X and COS(X) = 1. Exit. # # # # 8. Overwrite X by X := X rem 2Pi. Now that |X| <= Pi, # # go back to 2. # # # ######################################################################### SINA7: long 0xBD6AAA77,0xCCC994F5 SINA6: long 0x3DE61209,0x7AAE8DA1 SINA5: long 0xBE5AE645,0x2A118AE4 SINA4: long 0x3EC71DE3,0xA5341531 SINA3: long 0xBF2A01A0,0x1A018B59,0x00000000,0x00000000 SINA2: long 0x3FF80000,0x88888888,0x888859AF,0x00000000 SINA1: long 0xBFFC0000,0xAAAAAAAA,0xAAAAAA99,0x00000000 COSB8: long 0x3D2AC4D0,0xD6011EE3 COSB7: long 0xBDA9396F,0x9F45AC19 COSB6: long 0x3E21EED9,0x0612C972 COSB5: long 0xBE927E4F,0xB79D9FCF COSB4: long 0x3EFA01A0,0x1A01D423,0x00000000,0x00000000 COSB3: long 0xBFF50000,0xB60B60B6,0x0B61D438,0x00000000 COSB2: long 0x3FFA0000,0xAAAAAAAA,0xAAAAAB5E COSB1: long 0xBF000000 set INARG,FP_SCR0 set X,FP_SCR0 # set XDCARE,X+2 set XFRAC,X+4 set RPRIME,FP_SCR0 set SPRIME,FP_SCR1 set POSNEG1,L_SCR1 set TWOTO63,L_SCR1 set ENDFLAG,L_SCR2 set INT,L_SCR2 set ADJN,L_SCR3 ############################################ global ssin ssin: mov.l &0,ADJN(%a6) # yes; SET ADJN TO 0 bra.b SINBGN ############################################ global scos scos: mov.l &1,ADJN(%a6) # yes; SET ADJN TO 1 ############################################ SINBGN: #--SAVE FPCR, FP1. CHECK IF |X| IS TOO SMALL OR LARGE fmov.x (%a0),%fp0 # LOAD INPUT fmov.x %fp0,X(%a6) # save input at X # "COMPACTIFY" X mov.l (%a0),%d1 # put exp in hi word mov.w 4(%a0),%d1 # fetch hi(man) and.l &0x7FFFFFFF,%d1 # strip sign cmpi.l %d1,&0x3FD78000 # is |X| >= 2**(-40)? bge.b SOK1 # no bra.w SINSM # yes; input is very small SOK1: cmp.l %d1,&0x4004BC7E # is |X| < 15 PI? blt.b SINMAIN # no bra.w SREDUCEX # yes; input is very large #--THIS IS THE USUAL CASE, |X| <= 15 PI. #--THE ARGUMENT REDUCTION IS DONE BY TABLE LOOK UP. SINMAIN: fmov.x %fp0,%fp1 fmul.d TWOBYPI(%pc),%fp1 # X*2/PI lea PITBL+0x200(%pc),%a1 # TABLE OF N*PI/2, N = -32,...,32 fmov.l %fp1,INT(%a6) # CONVERT TO INTEGER mov.l INT(%a6),%d1 # make a copy of N asl.l &4,%d1 # N *= 16 add.l %d1,%a1 # tbl_addr = a1 + (N*16) # A1 IS THE ADDRESS OF N*PIBY2 # ...WHICH IS IN TWO PIECES Y1 & Y2 fsub.x (%a1)+,%fp0 # X-Y1 fsub.s (%a1),%fp0 # fp0 = R = (X-Y1)-Y2 SINCONT: #--continuation from REDUCEX #--GET N+ADJN AND SEE IF SIN(R) OR COS(R) IS NEEDED mov.l INT(%a6),%d1 add.l ADJN(%a6),%d1 # SEE IF D0 IS ODD OR EVEN ror.l &1,%d1 # D0 WAS ODD IFF D0 IS NEGATIVE cmp.l %d1,&0 blt.w COSPOLY #--LET J BE THE LEAST SIG. BIT OF D0, LET SGN := (-1)**J. #--THEN WE RETURN SGN*SIN(R). SGN*SIN(R) IS COMPUTED BY #--R' + R'*S*(A1 + S(A2 + S(A3 + S(A4 + ... + SA7)))), WHERE #--R' = SGN*R, S=R*R. THIS CAN BE REWRITTEN AS #--R' + R'*S*( [A1+T(A3+T(A5+TA7))] + [S(A2+T(A4+TA6))]) #--WHERE T=S*S. #--NOTE THAT A3 THROUGH A7 ARE STORED IN DOUBLE PRECISION #--WHILE A1 AND A2 ARE IN DOUBLE-EXTENDED FORMAT. SINPOLY: fmovm.x &0x0c,-(%sp) # save fp2/fp3 fmov.x %fp0,X(%a6) # X IS R fmul.x %fp0,%fp0 # FP0 IS S fmov.d SINA7(%pc),%fp3 fmov.d SINA6(%pc),%fp2 fmov.x %fp0,%fp1 fmul.x %fp1,%fp1 # FP1 IS T ror.l &1,%d1 and.l &0x80000000,%d1 # ...LEAST SIG. BIT OF D0 IN SIGN POSITION eor.l %d1,X(%a6) # X IS NOW R'= SGN*R fmul.x %fp1,%fp3 # TA7 fmul.x %fp1,%fp2 # TA6 fadd.d SINA5(%pc),%fp3 # A5+TA7 fadd.d SINA4(%pc),%fp2 # A4+TA6 fmul.x %fp1,%fp3 # T(A5+TA7) fmul.x %fp1,%fp2 # T(A4+TA6) fadd.d SINA3(%pc),%fp3 # A3+T(A5+TA7) fadd.x SINA2(%pc),%fp2 # A2+T(A4+TA6) fmul.x %fp3,%fp1 # T(A3+T(A5+TA7)) fmul.x %fp0,%fp2 # S(A2+T(A4+TA6)) fadd.x SINA1(%pc),%fp1 # A1+T(A3+T(A5+TA7)) fmul.x X(%a6),%fp0 # R'*S fadd.x %fp2,%fp1 # [A1+T(A3+T(A5+TA7))]+[S(A2+T(A4+TA6))] fmul.x %fp1,%fp0 # SIN(R')-R' fmovm.x (%sp)+,&0x30 # restore fp2/fp3 fmov.l %d0,%fpcr # restore users round mode,prec fadd.x X(%a6),%fp0 # last inst - possible exception set bra t_inx2 #--LET J BE THE LEAST SIG. BIT OF D0, LET SGN := (-1)**J. #--THEN WE RETURN SGN*COS(R). SGN*COS(R) IS COMPUTED BY #--SGN + S'*(B1 + S(B2 + S(B3 + S(B4 + ... + SB8)))), WHERE #--S=R*R AND S'=SGN*S. THIS CAN BE REWRITTEN AS #--SGN + S'*([B1+T(B3+T(B5+TB7))] + [S(B2+T(B4+T(B6+TB8)))]) #--WHERE T=S*S. #--NOTE THAT B4 THROUGH B8 ARE STORED IN DOUBLE PRECISION #--WHILE B2 AND B3 ARE IN DOUBLE-EXTENDED FORMAT, B1 IS -1/2 #--AND IS THEREFORE STORED AS SINGLE PRECISION. COSPOLY: fmovm.x &0x0c,-(%sp) # save fp2/fp3 fmul.x %fp0,%fp0 # FP0 IS S fmov.d COSB8(%pc),%fp2 fmov.d COSB7(%pc),%fp3 fmov.x %fp0,%fp1 fmul.x %fp1,%fp1 # FP1 IS T fmov.x %fp0,X(%a6) # X IS S ror.l &1,%d1 and.l &0x80000000,%d1 # ...LEAST SIG. BIT OF D0 IN SIGN POSITION fmul.x %fp1,%fp2 # TB8 eor.l %d1,X(%a6) # X IS NOW S'= SGN*S and.l &0x80000000,%d1 fmul.x %fp1,%fp3 # TB7 or.l &0x3F800000,%d1 # D0 IS SGN IN SINGLE mov.l %d1,POSNEG1(%a6) fadd.d COSB6(%pc),%fp2 # B6+TB8 fadd.d COSB5(%pc),%fp3 # B5+TB7 fmul.x %fp1,%fp2 # T(B6+TB8) fmul.x %fp1,%fp3 # T(B5+TB7) fadd.d COSB4(%pc),%fp2 # B4+T(B6+TB8) fadd.x COSB3(%pc),%fp3 # B3+T(B5+TB7) fmul.x %fp1,%fp2 # T(B4+T(B6+TB8)) fmul.x %fp3,%fp1 # T(B3+T(B5+TB7)) fadd.x COSB2(%pc),%fp2 # B2+T(B4+T(B6+TB8)) fadd.s COSB1(%pc),%fp1 # B1+T(B3+T(B5+TB7)) fmul.x %fp2,%fp0 # S(B2+T(B4+T(B6+TB8))) fadd.x %fp1,%fp0 fmul.x X(%a6),%fp0 fmovm.x (%sp)+,&0x30 # restore fp2/fp3 fmov.l %d0,%fpcr # restore users round mode,prec fadd.s POSNEG1(%a6),%fp0 # last inst - possible exception set bra t_inx2 ############################################## # SINe: Big OR Small? #--IF |X| > 15PI, WE USE THE GENERAL ARGUMENT REDUCTION. #--IF |X| < 2**(-40), RETURN X OR 1. SINBORS: cmp.l %d1,&0x3FFF8000 bgt.l SREDUCEX SINSM: mov.l ADJN(%a6),%d1 cmp.l %d1,&0 bgt.b COSTINY # here, the operation may underflow iff the precision is sgl or dbl. # extended denorms are handled through another entry point. SINTINY: # mov.w &0x0000,XDCARE(%a6) # JUST IN CASE fmov.l %d0,%fpcr # restore users round mode,prec mov.b &FMOV_OP,%d1 # last inst is MOVE fmov.x X(%a6),%fp0 # last inst - possible exception set bra t_catch COSTINY: fmov.s &0x3F800000,%fp0 # fp0 = 1.0 fmov.l %d0,%fpcr # restore users round mode,prec fadd.s &0x80800000,%fp0 # last inst - possible exception set bra t_pinx2 ################################################ global ssind #--SIN(X) = X FOR DENORMALIZED X ssind: bra t_extdnrm ############################################ global scosd #--COS(X) = 1 FOR DENORMALIZED X scosd: fmov.s &0x3F800000,%fp0 # fp0 = 1.0 bra t_pinx2 ################################################## global ssincos ssincos: #--SET ADJN TO 4 mov.l &4,ADJN(%a6) fmov.x (%a0),%fp0 # LOAD INPUT fmov.x %fp0,X(%a6) mov.l (%a0),%d1 mov.w 4(%a0),%d1 and.l &0x7FFFFFFF,%d1 # COMPACTIFY X cmp.l %d1,&0x3FD78000 # |X| >= 2**(-40)? bge.b SCOK1 bra.w SCSM SCOK1: cmp.l %d1,&0x4004BC7E # |X| < 15 PI? blt.b SCMAIN bra.w SREDUCEX #--THIS IS THE USUAL CASE, |X| <= 15 PI. #--THE ARGUMENT REDUCTION IS DONE BY TABLE LOOK UP. SCMAIN: fmov.x %fp0,%fp1 fmul.d TWOBYPI(%pc),%fp1 # X*2/PI lea PITBL+0x200(%pc),%a1 # TABLE OF N*PI/2, N = -32,...,32 fmov.l %fp1,INT(%a6) # CONVERT TO INTEGER mov.l INT(%a6),%d1 asl.l &4,%d1 add.l %d1,%a1 # ADDRESS OF N*PIBY2, IN Y1, Y2 fsub.x (%a1)+,%fp0 # X-Y1 fsub.s (%a1),%fp0 # FP0 IS R = (X-Y1)-Y2 SCCONT: #--continuation point from REDUCEX mov.l INT(%a6),%d1 ror.l &1,%d1 cmp.l %d1,&0 # D0 < 0 IFF N IS ODD bge.w NEVEN SNODD: #--REGISTERS SAVED SO FAR: D0, A0, FP2. fmovm.x &0x04,-(%sp) # save fp2 fmov.x %fp0,RPRIME(%a6) fmul.x %fp0,%fp0 # FP0 IS S = R*R fmov.d SINA7(%pc),%fp1 # A7 fmov.d COSB8(%pc),%fp2 # B8 fmul.x %fp0,%fp1 # SA7 fmul.x %fp0,%fp2 # SB8 mov.l %d2,-(%sp) mov.l %d1,%d2 ror.l &1,%d2 and.l &0x80000000,%d2 eor.l %d1,%d2 and.l &0x80000000,%d2 fadd.d SINA6(%pc),%fp1 # A6+SA7 fadd.d COSB7(%pc),%fp2 # B7+SB8 fmul.x %fp0,%fp1 # S(A6+SA7) eor.l %d2,RPRIME(%a6) mov.l (%sp)+,%d2 fmul.x %fp0,%fp2 # S(B7+SB8) ror.l &1,%d1 and.l &0x80000000,%d1 mov.l &0x3F800000,POSNEG1(%a6) eor.l %d1,POSNEG1(%a6) fadd.d SINA5(%pc),%fp1 # A5+S(A6+SA7) fadd.d COSB6(%pc),%fp2 # B6+S(B7+SB8) fmul.x %fp0,%fp1 # S(A5+S(A6+SA7)) fmul.x %fp0,%fp2 # S(B6+S(B7+SB8)) fmov.x %fp0,SPRIME(%a6) fadd.d SINA4(%pc),%fp1 # A4+S(A5+S(A6+SA7)) eor.l %d1,SPRIME(%a6) fadd.d COSB5(%pc),%fp2 # B5+S(B6+S(B7+SB8)) fmul.x %fp0,%fp1 # S(A4+...) fmul.x %fp0,%fp2 # S(B5+...) fadd.d SINA3(%pc),%fp1 # A3+S(A4+...) fadd.d COSB4(%pc),%fp2 # B4+S(B5+...) fmul.x %fp0,%fp1 # S(A3+...) fmul.x %fp0,%fp2 # S(B4+...) fadd.x SINA2(%pc),%fp1 # A2+S(A3+...) fadd.x COSB3(%pc),%fp2 # B3+S(B4+...) fmul.x %fp0,%fp1 # S(A2+...) fmul.x %fp0,%fp2 # S(B3+...) fadd.x SINA1(%pc),%fp1 # A1+S(A2+...) fadd.x COSB2(%pc),%fp2 # B2+S(B3+...) fmul.x %fp0,%fp1 # S(A1+...) fmul.x %fp2,%fp0 # S(B2+...) fmul.x RPRIME(%a6),%fp1 # R'S(A1+...) fadd.s COSB1(%pc),%fp0 # B1+S(B2...) fmul.x SPRIME(%a6),%fp0 # S'(B1+S(B2+...)) fmovm.x (%sp)+,&0x20 # restore fp2 fmov.l %d0,%fpcr fadd.x RPRIME(%a6),%fp1 # COS(X) bsr sto_cos # store cosine result fadd.s POSNEG1(%a6),%fp0 # SIN(X) bra t_inx2 NEVEN: #--REGISTERS SAVED SO FAR: FP2. fmovm.x &0x04,-(%sp) # save fp2 fmov.x %fp0,RPRIME(%a6) fmul.x %fp0,%fp0 # FP0 IS S = R*R fmov.d COSB8(%pc),%fp1 # B8 fmov.d SINA7(%pc),%fp2 # A7 fmul.x %fp0,%fp1 # SB8 fmov.x %fp0,SPRIME(%a6) fmul.x %fp0,%fp2 # SA7 ror.l &1,%d1 and.l &0x80000000,%d1 fadd.d COSB7(%pc),%fp1 # B7+SB8 fadd.d SINA6(%pc),%fp2 # A6+SA7 eor.l %d1,RPRIME(%a6) eor.l %d1,SPRIME(%a6) fmul.x %fp0,%fp1 # S(B7+SB8) or.l &0x3F800000,%d1 mov.l %d1,POSNEG1(%a6) fmul.x %fp0,%fp2 # S(A6+SA7) fadd.d COSB6(%pc),%fp1 # B6+S(B7+SB8) fadd.d SINA5(%pc),%fp2 # A5+S(A6+SA7) fmul.x %fp0,%fp1 # S(B6+S(B7+SB8)) fmul.x %fp0,%fp2 # S(A5+S(A6+SA7)) fadd.d COSB5(%pc),%fp1 # B5+S(B6+S(B7+SB8)) fadd.d SINA4(%pc),%fp2 # A4+S(A5+S(A6+SA7)) fmul.x %fp0,%fp1 # S(B5+...) fmul.x %fp0,%fp2 # S(A4+...) fadd.d COSB4(%pc),%fp1 # B4+S(B5+...) fadd.d SINA3(%pc),%fp2 # A3+S(A4+...) fmul.x %fp0,%fp1 # S(B4+...) fmul.x %fp0,%fp2 # S(A3+...) fadd.x COSB3(%pc),%fp1 # B3+S(B4+...) fadd.x SINA2(%pc),%fp2 # A2+S(A3+...) fmul.x %fp0,%fp1 # S(B3+...) fmul.x %fp0,%fp2 # S(A2+...) fadd.x COSB2(%pc),%fp1 # B2+S(B3+...) fadd.x SINA1(%pc),%fp2 # A1+S(A2+...) fmul.x %fp0,%fp1 # S(B2+...) fmul.x %fp2,%fp0 # s(a1+...) fadd.s COSB1(%pc),%fp1 # B1+S(B2...) fmul.x RPRIME(%a6),%fp0 # R'S(A1+...) fmul.x SPRIME(%a6),%fp1 # S'(B1+S(B2+...)) fmovm.x (%sp)+,&0x20 # restore fp2 fmov.l %d0,%fpcr fadd.s POSNEG1(%a6),%fp1 # COS(X) bsr sto_cos # store cosine result fadd.x RPRIME(%a6),%fp0 # SIN(X) bra t_inx2 ################################################ SCBORS: cmp.l %d1,&0x3FFF8000 bgt.w SREDUCEX ################################################ SCSM: # mov.w &0x0000,XDCARE(%a6) fmov.s &0x3F800000,%fp1 fmov.l %d0,%fpcr fsub.s &0x00800000,%fp1 bsr sto_cos # store cosine result fmov.l %fpcr,%d0 # d0 must have fpcr,too mov.b &FMOV_OP,%d1 # last inst is MOVE fmov.x X(%a6),%fp0 bra t_catch ############################################## global ssincosd #--SIN AND COS OF X FOR DENORMALIZED X ssincosd: mov.l %d0,-(%sp) # save d0 fmov.s &0x3F800000,%fp1 bsr sto_cos # store cosine result mov.l (%sp)+,%d0 # restore d0 bra t_extdnrm ############################################ #--WHEN REDUCEX IS USED, THE CODE WILL INEVITABLY BE SLOW. #--THIS REDUCTION METHOD, HOWEVER, IS MUCH FASTER THAN USING #--THE REMAINDER INSTRUCTION WHICH IS NOW IN SOFTWARE. SREDUCEX: fmovm.x &0x3c,-(%sp) # save {fp2-fp5} mov.l %d2,-(%sp) # save d2 fmov.s &0x00000000,%fp1 # fp1 = 0 #--If compact form of abs(arg) in d0=$7ffeffff, argument is so large that #--there is a danger of unwanted overflow in first LOOP iteration. In this #--case, reduce argument by one remainder step to make subsequent reduction #--safe. cmp.l %d1,&0x7ffeffff # is arg dangerously large? bne.b SLOOP # no # yes; create 2**16383*PI/2 mov.w &0x7ffe,FP_SCR0_EX(%a6) mov.l &0xc90fdaa2,FP_SCR0_HI(%a6) clr.l FP_SCR0_LO(%a6) # create low half of 2**16383*PI/2 at FP_SCR1 mov.w &0x7fdc,FP_SCR1_EX(%a6) mov.l &0x85a308d3,FP_SCR1_HI(%a6) clr.l FP_SCR1_LO(%a6) ftest.x %fp0 # test sign of argument fblt.w sred_neg or.b &0x80,FP_SCR0_EX(%a6) # positive arg or.b &0x80,FP_SCR1_EX(%a6) sred_neg: fadd.x FP_SCR0(%a6),%fp0 # high part of reduction is exact fmov.x %fp0,%fp1 # save high result in fp1 fadd.x FP_SCR1(%a6),%fp0 # low part of reduction fsub.x %fp0,%fp1 # determine low component of result fadd.x FP_SCR1(%a6),%fp1 # fp0/fp1 are reduced argument. #--ON ENTRY, FP0 IS X, ON RETURN, FP0 IS X REM PI/2, |X| <= PI/4. #--integer quotient will be stored in N #--Intermeditate remainder is 66-bit long; (R,r) in (FP0,FP1) SLOOP: fmov.x %fp0,INARG(%a6) # +-2**K * F, 1 <= F < 2 mov.w INARG(%a6),%d1 mov.l %d1,%a1 # save a copy of D0 and.l &0x00007FFF,%d1 sub.l &0x00003FFF,%d1 # d0 = K cmp.l %d1,&28 ble.b SLASTLOOP SCONTLOOP: sub.l &27,%d1 # d0 = L := K-27 mov.b &0,ENDFLAG(%a6) bra.b SWORK SLASTLOOP: clr.l %d1 # d0 = L := 0 mov.b &1,ENDFLAG(%a6) SWORK: #--FIND THE REMAINDER OF (R,r) W.R.T. 2**L * (PI/2). L IS SO CHOSEN #--THAT INT( X * (2/PI) / 2**(L) ) < 2**29. #--CREATE 2**(-L) * (2/PI), SIGN(INARG)*2**(63), #--2**L * (PIby2_1), 2**L * (PIby2_2) mov.l &0x00003FFE,%d2 # BIASED EXP OF 2/PI sub.l %d1,%d2 # BIASED EXP OF 2**(-L)*(2/PI) mov.l &0xA2F9836E,FP_SCR0_HI(%a6) mov.l &0x4E44152A,FP_SCR0_LO(%a6) mov.w %d2,FP_SCR0_EX(%a6) # FP_SCR0 = 2**(-L)*(2/PI) fmov.x %fp0,%fp2 fmul.x FP_SCR0(%a6),%fp2 # fp2 = X * 2**(-L)*(2/PI) #--WE MUST NOW FIND INT(FP2). SINCE WE NEED THIS VALUE IN #--FLOATING POINT FORMAT, THE TWO FMOVE'S FMOVE.L FP <--> N #--WILL BE TOO INEFFICIENT. THE WAY AROUND IT IS THAT #--(SIGN(INARG)*2**63 + FP2) - SIGN(INARG)*2**63 WILL GIVE #--US THE DESIRED VALUE IN FLOATING POINT. mov.l %a1,%d2 swap %d2 and.l &0x80000000,%d2 or.l &0x5F000000,%d2 # d2 = SIGN(INARG)*2**63 IN SGL mov.l %d2,TWOTO63(%a6) fadd.s TWOTO63(%a6),%fp2 # THE FRACTIONAL PART OF FP1 IS ROUNDED fsub.s TWOTO63(%a6),%fp2 # fp2 = N # fint.x %fp2 #--CREATING 2**(L)*Piby2_1 and 2**(L)*Piby2_2 mov.l %d1,%d2 # d2 = L add.l &0x00003FFF,%d2 # BIASED EXP OF 2**L * (PI/2) mov.w %d2,FP_SCR0_EX(%a6) mov.l &0xC90FDAA2,FP_SCR0_HI(%a6) clr.l FP_SCR0_LO(%a6) # FP_SCR0 = 2**(L) * Piby2_1 add.l &0x00003FDD,%d1 mov.w %d1,FP_SCR1_EX(%a6) mov.l &0x85A308D3,FP_SCR1_HI(%a6) clr.l FP_SCR1_LO(%a6) # FP_SCR1 = 2**(L) * Piby2_2 mov.b ENDFLAG(%a6),%d1 #--We are now ready to perform (R+r) - N*P1 - N*P2, P1 = 2**(L) * Piby2_1 and #--P2 = 2**(L) * Piby2_2 fmov.x %fp2,%fp4 # fp4 = N fmul.x FP_SCR0(%a6),%fp4 # fp4 = W = N*P1 fmov.x %fp2,%fp5 # fp5 = N fmul.x FP_SCR1(%a6),%fp5 # fp5 = w = N*P2 fmov.x %fp4,%fp3 # fp3 = W = N*P1 #--we want P+p = W+w but |p| <= half ulp of P #--Then, we need to compute A := R-P and a := r-p fadd.x %fp5,%fp3 # fp3 = P fsub.x %fp3,%fp4 # fp4 = W-P fsub.x %fp3,%fp0 # fp0 = A := R - P fadd.x %fp5,%fp4 # fp4 = p = (W-P)+w fmov.x %fp0,%fp3 # fp3 = A fsub.x %fp4,%fp1 # fp1 = a := r - p #--Now we need to normalize (A,a) to "new (R,r)" where R+r = A+a but #--|r| <= half ulp of R. fadd.x %fp1,%fp0 # fp0 = R := A+a #--No need to calculate r if this is the last loop cmp.b %d1,&0 bgt.w SRESTORE #--Need to calculate r fsub.x %fp0,%fp3 # fp3 = A-R fadd.x %fp3,%fp1 # fp1 = r := (A-R)+a bra.w SLOOP SRESTORE: fmov.l %fp2,INT(%a6) mov.l (%sp)+,%d2 # restore d2 fmovm.x (%sp)+,&0x3c # restore {fp2-fp5} mov.l ADJN(%a6),%d1 cmp.l %d1,&4 blt.w SINCONT bra.w SCCONT ######################################################################### # stan(): computes the tangent of a normalized input # # stand(): computes the tangent of a denormalized input # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # d0 = round precision,mode # # # # OUTPUT ************************************************************** # # fp0 = tan(X) # # # # ACCURACY and MONOTONICITY ******************************************* # # The returned result is within 3 ulp in 64 significant bit, i.e. # # within 0.5001 ulp to 53 bits if the result is subsequently # # rounded to double precision. The result is provably monotonic # # in double precision. # # # # ALGORITHM *********************************************************** # # # # 1. If |X| >= 15Pi or |X| < 2**(-40), go to 6. # # # # 2. Decompose X as X = N(Pi/2) + r where |r| <= Pi/4. Let # # k = N mod 2, so in particular, k = 0 or 1. # # # # 3. If k is odd, go to 5. # # # # 4. (k is even) Tan(X) = tan(r) and tan(r) is approximated by a # # rational function U/V where # # U = r + r*s*(P1 + s*(P2 + s*P3)), and # # V = 1 + s*(Q1 + s*(Q2 + s*(Q3 + s*Q4))), s = r*r. # # Exit. # # # # 4. (k is odd) Tan(X) = -cot(r). Since tan(r) is approximated by # # a rational function U/V where # # U = r + r*s*(P1 + s*(P2 + s*P3)), and # # V = 1 + s*(Q1 + s*(Q2 + s*(Q3 + s*Q4))), s = r*r, # # -Cot(r) = -V/U. Exit. # # # # 6. If |X| > 1, go to 8. # # # # 7. (|X|<2**(-40)) Tan(X) = X. Exit. # # # # 8. Overwrite X by X := X rem 2Pi. Now that |X| <= Pi, go back # # to 2. # # # ######################################################################### TANQ4: long 0x3EA0B759,0xF50F8688 TANP3: long 0xBEF2BAA5,0xA8924F04 TANQ3: long 0xBF346F59,0xB39BA65F,0x00000000,0x00000000 TANP2: long 0x3FF60000,0xE073D3FC,0x199C4A00,0x00000000 TANQ2: long 0x3FF90000,0xD23CD684,0x15D95FA1,0x00000000 TANP1: long 0xBFFC0000,0x8895A6C5,0xFB423BCA,0x00000000 TANQ1: long 0xBFFD0000,0xEEF57E0D,0xA84BC8CE,0x00000000 INVTWOPI: long 0x3FFC0000,0xA2F9836E,0x4E44152A,0x00000000 TWOPI1: long 0x40010000,0xC90FDAA2,0x00000000,0x00000000 TWOPI2: long 0x3FDF0000,0x85A308D4,0x00000000,0x00000000 #--N*PI/2, -32 <= N <= 32, IN A LEADING TERM IN EXT. AND TRAILING #--TERM IN SGL. NOTE THAT PI IS 64-BIT LONG, THUS N*PI/2 IS AT #--MOST 69 BITS LONG. # global PITBL PITBL: long 0xC0040000,0xC90FDAA2,0x2168C235,0x21800000 long 0xC0040000,0xC2C75BCD,0x105D7C23,0xA0D00000 long 0xC0040000,0xBC7EDCF7,0xFF523611,0xA1E80000 long 0xC0040000,0xB6365E22,0xEE46F000,0x21480000 long 0xC0040000,0xAFEDDF4D,0xDD3BA9EE,0xA1200000 long 0xC0040000,0xA9A56078,0xCC3063DD,0x21FC0000 long 0xC0040000,0xA35CE1A3,0xBB251DCB,0x21100000 long 0xC0040000,0x9D1462CE,0xAA19D7B9,0xA1580000 long 0xC0040000,0x96CBE3F9,0x990E91A8,0x21E00000 long 0xC0040000,0x90836524,0x88034B96,0x20B00000 long 0xC0040000,0x8A3AE64F,0x76F80584,0xA1880000 long 0xC0040000,0x83F2677A,0x65ECBF73,0x21C40000 long 0xC0030000,0xFB53D14A,0xA9C2F2C2,0x20000000 long 0xC0030000,0xEEC2D3A0,0x87AC669F,0x21380000 long 0xC0030000,0xE231D5F6,0x6595DA7B,0xA1300000 long 0xC0030000,0xD5A0D84C,0x437F4E58,0x9FC00000 long 0xC0030000,0xC90FDAA2,0x2168C235,0x21000000 long 0xC0030000,0xBC7EDCF7,0xFF523611,0xA1680000 long 0xC0030000,0xAFEDDF4D,0xDD3BA9EE,0xA0A00000 long 0xC0030000,0xA35CE1A3,0xBB251DCB,0x20900000 long 0xC0030000,0x96CBE3F9,0x990E91A8,0x21600000 long 0xC0030000,0x8A3AE64F,0x76F80584,0xA1080000 long 0xC0020000,0xFB53D14A,0xA9C2F2C2,0x1F800000 long 0xC0020000,0xE231D5F6,0x6595DA7B,0xA0B00000 long 0xC0020000,0xC90FDAA2,0x2168C235,0x20800000 long 0xC0020000,0xAFEDDF4D,0xDD3BA9EE,0xA0200000 long 0xC0020000,0x96CBE3F9,0x990E91A8,0x20E00000 long 0xC0010000,0xFB53D14A,0xA9C2F2C2,0x1F000000 long 0xC0010000,0xC90FDAA2,0x2168C235,0x20000000 long 0xC0010000,0x96CBE3F9,0x990E91A8,0x20600000 long 0xC0000000,0xC90FDAA2,0x2168C235,0x1F800000 long 0xBFFF0000,0xC90FDAA2,0x2168C235,0x1F000000 long 0x00000000,0x00000000,0x00000000,0x00000000 long 0x3FFF0000,0xC90FDAA2,0x2168C235,0x9F000000 long 0x40000000,0xC90FDAA2,0x2168C235,0x9F800000 long 0x40010000,0x96CBE3F9,0x990E91A8,0xA0600000 long 0x40010000,0xC90FDAA2,0x2168C235,0xA0000000 long 0x40010000,0xFB53D14A,0xA9C2F2C2,0x9F000000 long 0x40020000,0x96CBE3F9,0x990E91A8,0xA0E00000 long 0x40020000,0xAFEDDF4D,0xDD3BA9EE,0x20200000 long 0x40020000,0xC90FDAA2,0x2168C235,0xA0800000 long 0x40020000,0xE231D5F6,0x6595DA7B,0x20B00000 long 0x40020000,0xFB53D14A,0xA9C2F2C2,0x9F800000 long 0x40030000,0x8A3AE64F,0x76F80584,0x21080000 long 0x40030000,0x96CBE3F9,0x990E91A8,0xA1600000 long 0x40030000,0xA35CE1A3,0xBB251DCB,0xA0900000 long 0x40030000,0xAFEDDF4D,0xDD3BA9EE,0x20A00000 long 0x40030000,0xBC7EDCF7,0xFF523611,0x21680000 long 0x40030000,0xC90FDAA2,0x2168C235,0xA1000000 long 0x40030000,0xD5A0D84C,0x437F4E58,0x1FC00000 long 0x40030000,0xE231D5F6,0x6595DA7B,0x21300000 long 0x40030000,0xEEC2D3A0,0x87AC669F,0xA1380000 long 0x40030000,0xFB53D14A,0xA9C2F2C2,0xA0000000 long 0x40040000,0x83F2677A,0x65ECBF73,0xA1C40000 long 0x40040000,0x8A3AE64F,0x76F80584,0x21880000 long 0x40040000,0x90836524,0x88034B96,0xA0B00000 long 0x40040000,0x96CBE3F9,0x990E91A8,0xA1E00000 long 0x40040000,0x9D1462CE,0xAA19D7B9,0x21580000 long 0x40040000,0xA35CE1A3,0xBB251DCB,0xA1100000 long 0x40040000,0xA9A56078,0xCC3063DD,0xA1FC0000 long 0x40040000,0xAFEDDF4D,0xDD3BA9EE,0x21200000 long 0x40040000,0xB6365E22,0xEE46F000,0xA1480000 long 0x40040000,0xBC7EDCF7,0xFF523611,0x21E80000 long 0x40040000,0xC2C75BCD,0x105D7C23,0x20D00000 long 0x40040000,0xC90FDAA2,0x2168C235,0xA1800000 set INARG,FP_SCR0 set TWOTO63,L_SCR1 set INT,L_SCR1 set ENDFLAG,L_SCR2 global stan stan: fmov.x (%a0),%fp0 # LOAD INPUT mov.l (%a0),%d1 mov.w 4(%a0),%d1 and.l &0x7FFFFFFF,%d1 cmp.l %d1,&0x3FD78000 # |X| >= 2**(-40)? bge.b TANOK1 bra.w TANSM TANOK1: cmp.l %d1,&0x4004BC7E # |X| < 15 PI? blt.b TANMAIN bra.w REDUCEX TANMAIN: #--THIS IS THE USUAL CASE, |X| <= 15 PI. #--THE ARGUMENT REDUCTION IS DONE BY TABLE LOOK UP. fmov.x %fp0,%fp1 fmul.d TWOBYPI(%pc),%fp1 # X*2/PI lea.l PITBL+0x200(%pc),%a1 # TABLE OF N*PI/2, N = -32,...,32 fmov.l %fp1,%d1 # CONVERT TO INTEGER asl.l &4,%d1 add.l %d1,%a1 # ADDRESS N*PIBY2 IN Y1, Y2 fsub.x (%a1)+,%fp0 # X-Y1 fsub.s (%a1),%fp0 # FP0 IS R = (X-Y1)-Y2 ror.l &5,%d1 and.l &0x80000000,%d1 # D0 WAS ODD IFF D0 < 0 TANCONT: fmovm.x &0x0c,-(%sp) # save fp2,fp3 cmp.l %d1,&0 blt.w NODD fmov.x %fp0,%fp1 fmul.x %fp1,%fp1 # S = R*R fmov.d TANQ4(%pc),%fp3 fmov.d TANP3(%pc),%fp2 fmul.x %fp1,%fp3 # SQ4 fmul.x %fp1,%fp2 # SP3 fadd.d TANQ3(%pc),%fp3 # Q3+SQ4 fadd.x TANP2(%pc),%fp2 # P2+SP3 fmul.x %fp1,%fp3 # S(Q3+SQ4) fmul.x %fp1,%fp2 # S(P2+SP3) fadd.x TANQ2(%pc),%fp3 # Q2+S(Q3+SQ4) fadd.x TANP1(%pc),%fp2 # P1+S(P2+SP3) fmul.x %fp1,%fp3 # S(Q2+S(Q3+SQ4)) fmul.x %fp1,%fp2 # S(P1+S(P2+SP3)) fadd.x TANQ1(%pc),%fp3 # Q1+S(Q2+S(Q3+SQ4)) fmul.x %fp0,%fp2 # RS(P1+S(P2+SP3)) fmul.x %fp3,%fp1 # S(Q1+S(Q2+S(Q3+SQ4))) fadd.x %fp2,%fp0 # R+RS(P1+S(P2+SP3)) fadd.s &0x3F800000,%fp1 # 1+S(Q1+...) fmovm.x (%sp)+,&0x30 # restore fp2,fp3 fmov.l %d0,%fpcr # restore users round mode,prec fdiv.x %fp1,%fp0 # last inst - possible exception set bra t_inx2 NODD: fmov.x %fp0,%fp1 fmul.x %fp0,%fp0 # S = R*R fmov.d TANQ4(%pc),%fp3 fmov.d TANP3(%pc),%fp2 fmul.x %fp0,%fp3 # SQ4 fmul.x %fp0,%fp2 # SP3 fadd.d TANQ3(%pc),%fp3 # Q3+SQ4 fadd.x TANP2(%pc),%fp2 # P2+SP3 fmul.x %fp0,%fp3 # S(Q3+SQ4) fmul.x %fp0,%fp2 # S(P2+SP3) fadd.x TANQ2(%pc),%fp3 # Q2+S(Q3+SQ4) fadd.x TANP1(%pc),%fp2 # P1+S(P2+SP3) fmul.x %fp0,%fp3 # S(Q2+S(Q3+SQ4)) fmul.x %fp0,%fp2 # S(P1+S(P2+SP3)) fadd.x TANQ1(%pc),%fp3 # Q1+S(Q2+S(Q3+SQ4)) fmul.x %fp1,%fp2 # RS(P1+S(P2+SP3)) fmul.x %fp3,%fp0 # S(Q1+S(Q2+S(Q3+SQ4))) fadd.x %fp2,%fp1 # R+RS(P1+S(P2+SP3)) fadd.s &0x3F800000,%fp0 # 1+S(Q1+...) fmovm.x (%sp)+,&0x30 # restore fp2,fp3 fmov.x %fp1,-(%sp) eor.l &0x80000000,(%sp) fmov.l %d0,%fpcr # restore users round mode,prec fdiv.x (%sp)+,%fp0 # last inst - possible exception set bra t_inx2 TANBORS: #--IF |X| > 15PI, WE USE THE GENERAL ARGUMENT REDUCTION. #--IF |X| < 2**(-40), RETURN X OR 1. cmp.l %d1,&0x3FFF8000 bgt.b REDUCEX TANSM: fmov.x %fp0,-(%sp) fmov.l %d0,%fpcr # restore users round mode,prec mov.b &FMOV_OP,%d1 # last inst is MOVE fmov.x (%sp)+,%fp0 # last inst - posibble exception set bra t_catch global stand #--TAN(X) = X FOR DENORMALIZED X stand: bra t_extdnrm #--WHEN REDUCEX IS USED, THE CODE WILL INEVITABLY BE SLOW. #--THIS REDUCTION METHOD, HOWEVER, IS MUCH FASTER THAN USING #--THE REMAINDER INSTRUCTION WHICH IS NOW IN SOFTWARE. REDUCEX: fmovm.x &0x3c,-(%sp) # save {fp2-fp5} mov.l %d2,-(%sp) # save d2 fmov.s &0x00000000,%fp1 # fp1 = 0 #--If compact form of abs(arg) in d0=$7ffeffff, argument is so large that #--there is a danger of unwanted overflow in first LOOP iteration. In this #--case, reduce argument by one remainder step to make subsequent reduction #--safe. cmp.l %d1,&0x7ffeffff # is arg dangerously large? bne.b LOOP # no # yes; create 2**16383*PI/2 mov.w &0x7ffe,FP_SCR0_EX(%a6) mov.l &0xc90fdaa2,FP_SCR0_HI(%a6) clr.l FP_SCR0_LO(%a6) # create low half of 2**16383*PI/2 at FP_SCR1 mov.w &0x7fdc,FP_SCR1_EX(%a6) mov.l &0x85a308d3,FP_SCR1_HI(%a6) clr.l FP_SCR1_LO(%a6) ftest.x %fp0 # test sign of argument fblt.w red_neg or.b &0x80,FP_SCR0_EX(%a6) # positive arg or.b &0x80,FP_SCR1_EX(%a6) red_neg: fadd.x FP_SCR0(%a6),%fp0 # high part of reduction is exact fmov.x %fp0,%fp1 # save high result in fp1 fadd.x FP_SCR1(%a6),%fp0 # low part of reduction fsub.x %fp0,%fp1 # determine low component of result fadd.x FP_SCR1(%a6),%fp1 # fp0/fp1 are reduced argument. #--ON ENTRY, FP0 IS X, ON RETURN, FP0 IS X REM PI/2, |X| <= PI/4. #--integer quotient will be stored in N #--Intermeditate remainder is 66-bit long; (R,r) in (FP0,FP1) LOOP: fmov.x %fp0,INARG(%a6) # +-2**K * F, 1 <= F < 2 mov.w INARG(%a6),%d1 mov.l %d1,%a1 # save a copy of D0 and.l &0x00007FFF,%d1 sub.l &0x00003FFF,%d1 # d0 = K cmp.l %d1,&28 ble.b LASTLOOP CONTLOOP: sub.l &27,%d1 # d0 = L := K-27 mov.b &0,ENDFLAG(%a6) bra.b WORK LASTLOOP: clr.l %d1 # d0 = L := 0 mov.b &1,ENDFLAG(%a6) WORK: #--FIND THE REMAINDER OF (R,r) W.R.T. 2**L * (PI/2). L IS SO CHOSEN #--THAT INT( X * (2/PI) / 2**(L) ) < 2**29. #--CREATE 2**(-L) * (2/PI), SIGN(INARG)*2**(63), #--2**L * (PIby2_1), 2**L * (PIby2_2) mov.l &0x00003FFE,%d2 # BIASED EXP OF 2/PI sub.l %d1,%d2 # BIASED EXP OF 2**(-L)*(2/PI) mov.l &0xA2F9836E,FP_SCR0_HI(%a6) mov.l &0x4E44152A,FP_SCR0_LO(%a6) mov.w %d2,FP_SCR0_EX(%a6) # FP_SCR0 = 2**(-L)*(2/PI) fmov.x %fp0,%fp2 fmul.x FP_SCR0(%a6),%fp2 # fp2 = X * 2**(-L)*(2/PI) #--WE MUST NOW FIND INT(FP2). SINCE WE NEED THIS VALUE IN #--FLOATING POINT FORMAT, THE TWO FMOVE'S FMOVE.L FP <--> N #--WILL BE TOO INEFFICIENT. THE WAY AROUND IT IS THAT #--(SIGN(INARG)*2**63 + FP2) - SIGN(INARG)*2**63 WILL GIVE #--US THE DESIRED VALUE IN FLOATING POINT. mov.l %a1,%d2 swap %d2 and.l &0x80000000,%d2 or.l &0x5F000000,%d2 # d2 = SIGN(INARG)*2**63 IN SGL mov.l %d2,TWOTO63(%a6) fadd.s TWOTO63(%a6),%fp2 # THE FRACTIONAL PART OF FP1 IS ROUNDED fsub.s TWOTO63(%a6),%fp2 # fp2 = N # fintrz.x %fp2,%fp2 #--CREATING 2**(L)*Piby2_1 and 2**(L)*Piby2_2 mov.l %d1,%d2 # d2 = L add.l &0x00003FFF,%d2 # BIASED EXP OF 2**L * (PI/2) mov.w %d2,FP_SCR0_EX(%a6) mov.l &0xC90FDAA2,FP_SCR0_HI(%a6) clr.l FP_SCR0_LO(%a6) # FP_SCR0 = 2**(L) * Piby2_1 add.l &0x00003FDD,%d1 mov.w %d1,FP_SCR1_EX(%a6) mov.l &0x85A308D3,FP_SCR1_HI(%a6) clr.l FP_SCR1_LO(%a6) # FP_SCR1 = 2**(L) * Piby2_2 mov.b ENDFLAG(%a6),%d1 #--We are now ready to perform (R+r) - N*P1 - N*P2, P1 = 2**(L) * Piby2_1 and #--P2 = 2**(L) * Piby2_2 fmov.x %fp2,%fp4 # fp4 = N fmul.x FP_SCR0(%a6),%fp4 # fp4 = W = N*P1 fmov.x %fp2,%fp5 # fp5 = N fmul.x FP_SCR1(%a6),%fp5 # fp5 = w = N*P2 fmov.x %fp4,%fp3 # fp3 = W = N*P1 #--we want P+p = W+w but |p| <= half ulp of P #--Then, we need to compute A := R-P and a := r-p fadd.x %fp5,%fp3 # fp3 = P fsub.x %fp3,%fp4 # fp4 = W-P fsub.x %fp3,%fp0 # fp0 = A := R - P fadd.x %fp5,%fp4 # fp4 = p = (W-P)+w fmov.x %fp0,%fp3 # fp3 = A fsub.x %fp4,%fp1 # fp1 = a := r - p #--Now we need to normalize (A,a) to "new (R,r)" where R+r = A+a but #--|r| <= half ulp of R. fadd.x %fp1,%fp0 # fp0 = R := A+a #--No need to calculate r if this is the last loop cmp.b %d1,&0 bgt.w RESTORE #--Need to calculate r fsub.x %fp0,%fp3 # fp3 = A-R fadd.x %fp3,%fp1 # fp1 = r := (A-R)+a bra.w LOOP RESTORE: fmov.l %fp2,INT(%a6) mov.l (%sp)+,%d2 # restore d2 fmovm.x (%sp)+,&0x3c # restore {fp2-fp5} mov.l INT(%a6),%d1 ror.l &1,%d1 bra.w TANCONT ######################################################################### # satan(): computes the arctangent of a normalized number # # satand(): computes the arctangent of a denormalized number # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # d0 = round precision,mode # # # # OUTPUT ************************************************************** # # fp0 = arctan(X) # # # # ACCURACY and MONOTONICITY ******************************************* # # The returned result is within 2 ulps in 64 significant bit, # # i.e. within 0.5001 ulp to 53 bits if the result is subsequently # # rounded to double precision. The result is provably monotonic # # in double precision. # # # # ALGORITHM *********************************************************** # # Step 1. If |X| >= 16 or |X| < 1/16, go to Step 5. # # # # Step 2. Let X = sgn * 2**k * 1.xxxxxxxx...x. # # Note that k = -4, -3,..., or 3. # # Define F = sgn * 2**k * 1.xxxx1, i.e. the first 5 # # significant bits of X with a bit-1 attached at the 6-th # # bit position. Define u to be u = (X-F) / (1 + X*F). # # # # Step 3. Approximate arctan(u) by a polynomial poly. # # # # Step 4. Return arctan(F) + poly, arctan(F) is fetched from a # # table of values calculated beforehand. Exit. # # # # Step 5. If |X| >= 16, go to Step 7. # # # # Step 6. Approximate arctan(X) by an odd polynomial in X. Exit. # # # # Step 7. Define X' = -1/X. Approximate arctan(X') by an odd # # polynomial in X'. # # Arctan(X) = sign(X)*Pi/2 + arctan(X'). Exit. # # # ######################################################################### ATANA3: long 0xBFF6687E,0x314987D8 ATANA2: long 0x4002AC69,0x34A26DB3 ATANA1: long 0xBFC2476F,0x4E1DA28E ATANB6: long 0x3FB34444,0x7F876989 ATANB5: long 0xBFB744EE,0x7FAF45DB ATANB4: long 0x3FBC71C6,0x46940220 ATANB3: long 0xBFC24924,0x921872F9 ATANB2: long 0x3FC99999,0x99998FA9 ATANB1: long 0xBFD55555,0x55555555 ATANC5: long 0xBFB70BF3,0x98539E6A ATANC4: long 0x3FBC7187,0x962D1D7D ATANC3: long 0xBFC24924,0x827107B8 ATANC2: long 0x3FC99999,0x9996263E ATANC1: long 0xBFD55555,0x55555536 PPIBY2: long 0x3FFF0000,0xC90FDAA2,0x2168C235,0x00000000 NPIBY2: long 0xBFFF0000,0xC90FDAA2,0x2168C235,0x00000000 PTINY: long 0x00010000,0x80000000,0x00000000,0x00000000 NTINY: long 0x80010000,0x80000000,0x00000000,0x00000000 ATANTBL: long 0x3FFB0000,0x83D152C5,0x060B7A51,0x00000000 long 0x3FFB0000,0x8BC85445,0x65498B8B,0x00000000 long 0x3FFB0000,0x93BE4060,0x17626B0D,0x00000000 long 0x3FFB0000,0x9BB3078D,0x35AEC202,0x00000000 long 0x3FFB0000,0xA3A69A52,0x5DDCE7DE,0x00000000 long 0x3FFB0000,0xAB98E943,0x62765619,0x00000000 long 0x3FFB0000,0xB389E502,0xF9C59862,0x00000000 long 0x3FFB0000,0xBB797E43,0x6B09E6FB,0x00000000 long 0x3FFB0000,0xC367A5C7,0x39E5F446,0x00000000 long 0x3FFB0000,0xCB544C61,0xCFF7D5C6,0x00000000 long 0x3FFB0000,0xD33F62F8,0x2488533E,0x00000000 long 0x3FFB0000,0xDB28DA81,0x62404C77,0x00000000 long 0x3FFB0000,0xE310A407,0x8AD34F18,0x00000000 long 0x3FFB0000,0xEAF6B0A8,0x188EE1EB,0x00000000 long 0x3FFB0000,0xF2DAF194,0x9DBE79D5,0x00000000 long 0x3FFB0000,0xFABD5813,0x61D47E3E,0x00000000 long 0x3FFC0000,0x8346AC21,0x0959ECC4,0x00000000 long 0x3FFC0000,0x8B232A08,0x304282D8,0x00000000 long 0x3FFC0000,0x92FB70B8,0xD29AE2F9,0x00000000 long 0x3FFC0000,0x9ACF476F,0x5CCD1CB4,0x00000000 long 0x3FFC0000,0xA29E7630,0x4954F23F,0x00000000 long 0x3FFC0000,0xAA68C5D0,0x8AB85230,0x00000000 long 0x3FFC0000,0xB22DFFFD,0x9D539F83,0x00000000 long 0x3FFC0000,0xB9EDEF45,0x3E900EA5,0x00000000 long 0x3FFC0000,0xC1A85F1C,0xC75E3EA5,0x00000000 long 0x3FFC0000,0xC95D1BE8,0x28138DE6,0x00000000 long 0x3FFC0000,0xD10BF300,0x840D2DE4,0x00000000 long 0x3FFC0000,0xD8B4B2BA,0x6BC05E7A,0x00000000 long 0x3FFC0000,0xE0572A6B,0xB42335F6,0x00000000 long 0x3FFC0000,0xE7F32A70,0xEA9CAA8F,0x00000000 long 0x3FFC0000,0xEF888432,0x64ECEFAA,0x00000000 long 0x3FFC0000,0xF7170A28,0xECC06666,0x00000000 long 0x3FFD0000,0x812FD288,0x332DAD32,0x00000000 long 0x3FFD0000,0x88A8D1B1,0x218E4D64,0x00000000 long 0x3FFD0000,0x9012AB3F,0x23E4AEE8,0x00000000 long 0x3FFD0000,0x976CC3D4,0x11E7F1B9,0x00000000 long 0x3FFD0000,0x9EB68949,0x3889A227,0x00000000 long 0x3FFD0000,0xA5EF72C3,0x4487361B,0x00000000 long 0x3FFD0000,0xAD1700BA,0xF07A7227,0x00000000 long 0x3FFD0000,0xB42CBCFA,0xFD37EFB7,0x00000000 long 0x3FFD0000,0xBB303A94,0x0BA80F89,0x00000000 long 0x3FFD0000,0xC22115C6,0xFCAEBBAF,0x00000000 long 0x3FFD0000,0xC8FEF3E6,0x86331221,0x00000000 long 0x3FFD0000,0xCFC98330,0xB4000C70,0x00000000 long 0x3FFD0000,0xD6807AA1,0x102C5BF9,0x00000000 long 0x3FFD0000,0xDD2399BC,0x31252AA3,0x00000000 long 0x3FFD0000,0xE3B2A855,0x6B8FC517,0x00000000 long 0x3FFD0000,0xEA2D764F,0x64315989,0x00000000 long 0x3FFD0000,0xF3BF5BF8,0xBAD1A21D,0x00000000 long 0x3FFE0000,0x801CE39E,0x0D205C9A,0x00000000 long 0x3FFE0000,0x8630A2DA,0xDA1ED066,0x00000000 long 0x3FFE0000,0x8C1AD445,0xF3E09B8C,0x00000000 long 0x3FFE0000,0x91DB8F16,0x64F350E2,0x00000000 long 0x3FFE0000,0x97731420,0x365E538C,0x00000000 long 0x3FFE0000,0x9CE1C8E6,0xA0B8CDBA,0x00000000 long 0x3FFE0000,0xA22832DB,0xCADAAE09,0x00000000 long 0x3FFE0000,0xA746F2DD,0xB7602294,0x00000000 long 0x3FFE0000,0xAC3EC0FB,0x997DD6A2,0x00000000 long 0x3FFE0000,0xB110688A,0xEBDC6F6A,0x00000000 long 0x3FFE0000,0xB5BCC490,0x59ECC4B0,0x00000000 long 0x3FFE0000,0xBA44BC7D,0xD470782F,0x00000000 long 0x3FFE0000,0xBEA94144,0xFD049AAC,0x00000000 long 0x3FFE0000,0xC2EB4ABB,0x661628B6,0x00000000 long 0x3FFE0000,0xC70BD54C,0xE602EE14,0x00000000 long 0x3FFE0000,0xCD000549,0xADEC7159,0x00000000 long 0x3FFE0000,0xD48457D2,0xD8EA4EA3,0x00000000 long 0x3FFE0000,0xDB948DA7,0x12DECE3B,0x00000000 long 0x3FFE0000,0xE23855F9,0x69E8096A,0x00000000 long 0x3FFE0000,0xE8771129,0xC4353259,0x00000000 long 0x3FFE0000,0xEE57C16E,0x0D379C0D,0x00000000 long 0x3FFE0000,0xF3E10211,0xA87C3779,0x00000000 long 0x3FFE0000,0xF919039D,0x758B8D41,0x00000000 long 0x3FFE0000,0xFE058B8F,0x64935FB3,0x00000000 long 0x3FFF0000,0x8155FB49,0x7B685D04,0x00000000 long 0x3FFF0000,0x83889E35,0x49D108E1,0x00000000 long 0x3FFF0000,0x859CFA76,0x511D724B,0x00000000 long 0x3FFF0000,0x87952ECF,0xFF8131E7,0x00000000 long 0x3FFF0000,0x89732FD1,0x9557641B,0x00000000 long 0x3FFF0000,0x8B38CAD1,0x01932A35,0x00000000 long 0x3FFF0000,0x8CE7A8D8,0x301EE6B5,0x00000000 long 0x3FFF0000,0x8F46A39E,0x2EAE5281,0x00000000 long 0x3FFF0000,0x922DA7D7,0x91888487,0x00000000 long 0x3FFF0000,0x94D19FCB,0xDEDF5241,0x00000000 long 0x3FFF0000,0x973AB944,0x19D2A08B,0x00000000 long 0x3FFF0000,0x996FF00E,0x08E10B96,0x00000000 long 0x3FFF0000,0x9B773F95,0x12321DA7,0x00000000 long 0x3FFF0000,0x9D55CC32,0x0F935624,0x00000000 long 0x3FFF0000,0x9F100575,0x006CC571,0x00000000 long 0x3FFF0000,0xA0A9C290,0xD97CC06C,0x00000000 long 0x3FFF0000,0xA22659EB,0xEBC0630A,0x00000000 long 0x3FFF0000,0xA388B4AF,0xF6EF0EC9,0x00000000 long 0x3FFF0000,0xA4D35F10,0x61D292C4,0x00000000 long 0x3FFF0000,0xA60895DC,0xFBE3187E,0x00000000 long 0x3FFF0000,0xA72A51DC,0x7367BEAC,0x00000000 long 0x3FFF0000,0xA83A5153,0x0956168F,0x00000000 long 0x3FFF0000,0xA93A2007,0x7539546E,0x00000000 long 0x3FFF0000,0xAA9E7245,0x023B2605,0x00000000 long 0x3FFF0000,0xAC4C84BA,0x6FE4D58F,0x00000000 long 0x3FFF0000,0xADCE4A4A,0x606B9712,0x00000000 long 0x3FFF0000,0xAF2A2DCD,0x8D263C9C,0x00000000 long 0x3FFF0000,0xB0656F81,0xF22265C7,0x00000000 long 0x3FFF0000,0xB1846515,0x0F71496A,0x00000000 long 0x3FFF0000,0xB28AAA15,0x6F9ADA35,0x00000000 long 0x3FFF0000,0xB37B44FF,0x3766B895,0x00000000 long 0x3FFF0000,0xB458C3DC,0xE9630433,0x00000000 long 0x3FFF0000,0xB525529D,0x562246BD,0x00000000 long 0x3FFF0000,0xB5E2CCA9,0x5F9D88CC,0x00000000 long 0x3FFF0000,0xB692CADA,0x7ACA1ADA,0x00000000 long 0x3FFF0000,0xB736AEA7,0xA6925838,0x00000000 long 0x3FFF0000,0xB7CFAB28,0x7E9F7B36,0x00000000 long 0x3FFF0000,0xB85ECC66,0xCB219835,0x00000000 long 0x3FFF0000,0xB8E4FD5A,0x20A593DA,0x00000000 long 0x3FFF0000,0xB99F41F6,0x4AFF9BB5,0x00000000 long 0x3FFF0000,0xBA7F1E17,0x842BBE7B,0x00000000 long 0x3FFF0000,0xBB471285,0x7637E17D,0x00000000 long 0x3FFF0000,0xBBFABE8A,0x4788DF6F,0x00000000 long 0x3FFF0000,0xBC9D0FAD,0x2B689D79,0x00000000 long 0x3FFF0000,0xBD306A39,0x471ECD86,0x00000000 long 0x3FFF0000,0xBDB6C731,0x856AF18A,0x00000000 long 0x3FFF0000,0xBE31CAC5,0x02E80D70,0x00000000 long 0x3FFF0000,0xBEA2D55C,0xE33194E2,0x00000000 long 0x3FFF0000,0xBF0B10B7,0xC03128F0,0x00000000 long 0x3FFF0000,0xBF6B7A18,0xDACB778D,0x00000000 long 0x3FFF0000,0xBFC4EA46,0x63FA18F6,0x00000000 long 0x3FFF0000,0xC0181BDE,0x8B89A454,0x00000000 long 0x3FFF0000,0xC065B066,0xCFBF6439,0x00000000 long 0x3FFF0000,0xC0AE345F,0x56340AE6,0x00000000 long 0x3FFF0000,0xC0F22291,0x9CB9E6A7,0x00000000 set X,FP_SCR0 set XDCARE,X+2 set XFRAC,X+4 set XFRACLO,X+8 set ATANF,FP_SCR1 set ATANFHI,ATANF+4 set ATANFLO,ATANF+8 global satan #--ENTRY POINT FOR ATAN(X), HERE X IS FINITE, NON-ZERO, AND NOT NAN'S satan: fmov.x (%a0),%fp0 # LOAD INPUT mov.l (%a0),%d1 mov.w 4(%a0),%d1 fmov.x %fp0,X(%a6) and.l &0x7FFFFFFF,%d1 cmp.l %d1,&0x3FFB8000 # |X| >= 1/16? bge.b ATANOK1 bra.w ATANSM ATANOK1: cmp.l %d1,&0x4002FFFF # |X| < 16 ? ble.b ATANMAIN bra.w ATANBIG #--THE MOST LIKELY CASE, |X| IN [1/16, 16). WE USE TABLE TECHNIQUE #--THE IDEA IS ATAN(X) = ATAN(F) + ATAN( [X-F] / [1+XF] ). #--SO IF F IS CHOSEN TO BE CLOSE TO X AND ATAN(F) IS STORED IN #--A TABLE, ALL WE NEED IS TO APPROXIMATE ATAN(U) WHERE #--U = (X-F)/(1+XF) IS SMALL (REMEMBER F IS CLOSE TO X). IT IS #--TRUE THAT A DIVIDE IS NOW NEEDED, BUT THE APPROXIMATION FOR #--ATAN(U) IS A VERY SHORT POLYNOMIAL AND THE INDEXING TO #--FETCH F AND SAVING OF REGISTERS CAN BE ALL HIDED UNDER THE #--DIVIDE. IN THE END THIS METHOD IS MUCH FASTER THAN A TRADITIONAL #--ONE. NOTE ALSO THAT THE TRADITIONAL SCHEME THAT APPROXIMATE #--ATAN(X) DIRECTLY WILL NEED TO USE A RATIONAL APPROXIMATION #--(DIVISION NEEDED) ANYWAY BECAUSE A POLYNOMIAL APPROXIMATION #--WILL INVOLVE A VERY LONG POLYNOMIAL. #--NOW WE SEE X AS +-2^K * 1.BBBBBBB....B <- 1. + 63 BITS #--WE CHOSE F TO BE +-2^K * 1.BBBB1 #--THAT IS IT MATCHES THE EXPONENT AND FIRST 5 BITS OF X, THE #--SIXTH BITS IS SET TO BE 1. SINCE K = -4, -3, ..., 3, THERE #--ARE ONLY 8 TIMES 16 = 2^7 = 128 |F|'S. SINCE ATAN(-|F|) IS #-- -ATAN(|F|), WE NEED TO STORE ONLY ATAN(|F|). ATANMAIN: and.l &0xF8000000,XFRAC(%a6) # FIRST 5 BITS or.l &0x04000000,XFRAC(%a6) # SET 6-TH BIT TO 1 mov.l &0x00000000,XFRACLO(%a6) # LOCATION OF X IS NOW F fmov.x %fp0,%fp1 # FP1 IS X fmul.x X(%a6),%fp1 # FP1 IS X*F, NOTE THAT X*F > 0 fsub.x X(%a6),%fp0 # FP0 IS X-F fadd.s &0x3F800000,%fp1 # FP1 IS 1 + X*F fdiv.x %fp1,%fp0 # FP0 IS U = (X-F)/(1+X*F) #--WHILE THE DIVISION IS TAKING ITS TIME, WE FETCH ATAN(|F|) #--CREATE ATAN(F) AND STORE IT IN ATANF, AND #--SAVE REGISTERS FP2. mov.l %d2,-(%sp) # SAVE d2 TEMPORARILY mov.l %d1,%d2 # THE EXP AND 16 BITS OF X and.l &0x00007800,%d1 # 4 VARYING BITS OF F'S FRACTION and.l &0x7FFF0000,%d2 # EXPONENT OF F sub.l &0x3FFB0000,%d2 # K+4 asr.l &1,%d2 add.l %d2,%d1 # THE 7 BITS IDENTIFYING F asr.l &7,%d1 # INDEX INTO TBL OF ATAN(|F|) lea ATANTBL(%pc),%a1 add.l %d1,%a1 # ADDRESS OF ATAN(|F|) mov.l (%a1)+,ATANF(%a6) mov.l (%a1)+,ATANFHI(%a6) mov.l (%a1)+,ATANFLO(%a6) # ATANF IS NOW ATAN(|F|) mov.l X(%a6),%d1 # LOAD SIGN AND EXPO. AGAIN and.l &0x80000000,%d1 # SIGN(F) or.l %d1,ATANF(%a6) # ATANF IS NOW SIGN(F)*ATAN(|F|) mov.l (%sp)+,%d2 # RESTORE d2 #--THAT'S ALL I HAVE TO DO FOR NOW, #--BUT ALAS, THE DIVIDE IS STILL CRANKING! #--U IN FP0, WE ARE NOW READY TO COMPUTE ATAN(U) AS #--U + A1*U*V*(A2 + V*(A3 + V)), V = U*U #--THE POLYNOMIAL MAY LOOK STRANGE, BUT IS NEVERTHELESS CORRECT. #--THE NATURAL FORM IS U + U*V*(A1 + V*(A2 + V*A3)) #--WHAT WE HAVE HERE IS MERELY A1 = A3, A2 = A1/A3, A3 = A2/A3. #--THE REASON FOR THIS REARRANGEMENT IS TO MAKE THE INDEPENDENT #--PARTS A1*U*V AND (A2 + ... STUFF) MORE LOAD-BALANCED fmovm.x &0x04,-(%sp) # save fp2 fmov.x %fp0,%fp1 fmul.x %fp1,%fp1 fmov.d ATANA3(%pc),%fp2 fadd.x %fp1,%fp2 # A3+V fmul.x %fp1,%fp2 # V*(A3+V) fmul.x %fp0,%fp1 # U*V fadd.d ATANA2(%pc),%fp2 # A2+V*(A3+V) fmul.d ATANA1(%pc),%fp1 # A1*U*V fmul.x %fp2,%fp1 # A1*U*V*(A2+V*(A3+V)) fadd.x %fp1,%fp0 # ATAN(U), FP1 RELEASED fmovm.x (%sp)+,&0x20 # restore fp2 fmov.l %d0,%fpcr # restore users rnd mode,prec fadd.x ATANF(%a6),%fp0 # ATAN(X) bra t_inx2 ATANBORS: #--|X| IS IN d0 IN COMPACT FORM. FP1, d0 SAVED. #--FP0 IS X AND |X| <= 1/16 OR |X| >= 16. cmp.l %d1,&0x3FFF8000 bgt.w ATANBIG # I.E. |X| >= 16 ATANSM: #--|X| <= 1/16 #--IF |X| < 2^(-40), RETURN X AS ANSWER. OTHERWISE, APPROXIMATE #--ATAN(X) BY X + X*Y*(B1+Y*(B2+Y*(B3+Y*(B4+Y*(B5+Y*B6))))) #--WHICH IS X + X*Y*( [B1+Z*(B3+Z*B5)] + [Y*(B2+Z*(B4+Z*B6)] ) #--WHERE Y = X*X, AND Z = Y*Y. cmp.l %d1,&0x3FD78000 blt.w ATANTINY #--COMPUTE POLYNOMIAL fmovm.x &0x0c,-(%sp) # save fp2/fp3 fmul.x %fp0,%fp0 # FPO IS Y = X*X fmov.x %fp0,%fp1 fmul.x %fp1,%fp1 # FP1 IS Z = Y*Y fmov.d ATANB6(%pc),%fp2 fmov.d ATANB5(%pc),%fp3 fmul.x %fp1,%fp2 # Z*B6 fmul.x %fp1,%fp3 # Z*B5 fadd.d ATANB4(%pc),%fp2 # B4+Z*B6 fadd.d ATANB3(%pc),%fp3 # B3+Z*B5 fmul.x %fp1,%fp2 # Z*(B4+Z*B6) fmul.x %fp3,%fp1 # Z*(B3+Z*B5) fadd.d ATANB2(%pc),%fp2 # B2+Z*(B4+Z*B6) fadd.d ATANB1(%pc),%fp1 # B1+Z*(B3+Z*B5) fmul.x %fp0,%fp2 # Y*(B2+Z*(B4+Z*B6)) fmul.x X(%a6),%fp0 # X*Y fadd.x %fp2,%fp1 # [B1+Z*(B3+Z*B5)]+[Y*(B2+Z*(B4+Z*B6))] fmul.x %fp1,%fp0 # X*Y*([B1+Z*(B3+Z*B5)]+[Y*(B2+Z*(B4+Z*B6))]) fmovm.x (%sp)+,&0x30 # restore fp2/fp3 fmov.l %d0,%fpcr # restore users rnd mode,prec fadd.x X(%a6),%fp0 bra t_inx2 ATANTINY: #--|X| < 2^(-40), ATAN(X) = X fmov.l %d0,%fpcr # restore users rnd mode,prec mov.b &FMOV_OP,%d1 # last inst is MOVE fmov.x X(%a6),%fp0 # last inst - possible exception set bra t_catch ATANBIG: #--IF |X| > 2^(100), RETURN SIGN(X)*(PI/2 - TINY). OTHERWISE, #--RETURN SIGN(X)*PI/2 + ATAN(-1/X). cmp.l %d1,&0x40638000 bgt.w ATANHUGE #--APPROXIMATE ATAN(-1/X) BY #--X'+X'*Y*(C1+Y*(C2+Y*(C3+Y*(C4+Y*C5)))), X' = -1/X, Y = X'*X' #--THIS CAN BE RE-WRITTEN AS #--X'+X'*Y*( [C1+Z*(C3+Z*C5)] + [Y*(C2+Z*C4)] ), Z = Y*Y. fmovm.x &0x0c,-(%sp) # save fp2/fp3 fmov.s &0xBF800000,%fp1 # LOAD -1 fdiv.x %fp0,%fp1 # FP1 IS -1/X #--DIVIDE IS STILL CRANKING fmov.x %fp1,%fp0 # FP0 IS X' fmul.x %fp0,%fp0 # FP0 IS Y = X'*X' fmov.x %fp1,X(%a6) # X IS REALLY X' fmov.x %fp0,%fp1 fmul.x %fp1,%fp1 # FP1 IS Z = Y*Y fmov.d ATANC5(%pc),%fp3 fmov.d ATANC4(%pc),%fp2 fmul.x %fp1,%fp3 # Z*C5 fmul.x %fp1,%fp2 # Z*B4 fadd.d ATANC3(%pc),%fp3 # C3+Z*C5 fadd.d ATANC2(%pc),%fp2 # C2+Z*C4 fmul.x %fp3,%fp1 # Z*(C3+Z*C5), FP3 RELEASED fmul.x %fp0,%fp2 # Y*(C2+Z*C4) fadd.d ATANC1(%pc),%fp1 # C1+Z*(C3+Z*C5) fmul.x X(%a6),%fp0 # X'*Y fadd.x %fp2,%fp1 # [Y*(C2+Z*C4)]+[C1+Z*(C3+Z*C5)] fmul.x %fp1,%fp0 # X'*Y*([B1+Z*(B3+Z*B5)] # ... +[Y*(B2+Z*(B4+Z*B6))]) fadd.x X(%a6),%fp0 fmovm.x (%sp)+,&0x30 # restore fp2/fp3 fmov.l %d0,%fpcr # restore users rnd mode,prec tst.b (%a0) bpl.b pos_big neg_big: fadd.x NPIBY2(%pc),%fp0 bra t_minx2 pos_big: fadd.x PPIBY2(%pc),%fp0 bra t_pinx2 ATANHUGE: #--RETURN SIGN(X)*(PIBY2 - TINY) = SIGN(X)*PIBY2 - SIGN(X)*TINY tst.b (%a0) bpl.b pos_huge neg_huge: fmov.x NPIBY2(%pc),%fp0 fmov.l %d0,%fpcr fadd.x PTINY(%pc),%fp0 bra t_minx2 pos_huge: fmov.x PPIBY2(%pc),%fp0 fmov.l %d0,%fpcr fadd.x NTINY(%pc),%fp0 bra t_pinx2 global satand #--ENTRY POINT FOR ATAN(X) FOR DENORMALIZED ARGUMENT satand: bra t_extdnrm ######################################################################### # sasin(): computes the inverse sine of a normalized input # # sasind(): computes the inverse sine of a denormalized input # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # d0 = round precision,mode # # # # OUTPUT ************************************************************** # # fp0 = arcsin(X) # # # # ACCURACY and MONOTONICITY ******************************************* # # The returned result is within 3 ulps in 64 significant bit, # # i.e. within 0.5001 ulp to 53 bits if the result is subsequently # # rounded to double precision. The result is provably monotonic # # in double precision. # # # # ALGORITHM *********************************************************** # # # # ASIN # # 1. If |X| >= 1, go to 3. # # # # 2. (|X| < 1) Calculate asin(X) by # # z := sqrt( [1-X][1+X] ) # # asin(X) = atan( x / z ). # # Exit. # # # # 3. If |X| > 1, go to 5. # # # # 4. (|X| = 1) sgn := sign(X), return asin(X) := sgn * Pi/2. Exit.# # # # 5. (|X| > 1) Generate an invalid operation by 0 * infinity. # # Exit. # # # ######################################################################### global sasin sasin: fmov.x (%a0),%fp0 # LOAD INPUT mov.l (%a0),%d1 mov.w 4(%a0),%d1 and.l &0x7FFFFFFF,%d1 cmp.l %d1,&0x3FFF8000 bge.b ASINBIG # This catch is added here for the '060 QSP. Originally, the call to # satan() would handle this case by causing the exception which would # not be caught until gen_except(). Now, with the exceptions being # detected inside of satan(), the exception would have been handled there # instead of inside sasin() as expected. cmp.l %d1,&0x3FD78000 blt.w ASINTINY #--THIS IS THE USUAL CASE, |X| < 1 #--ASIN(X) = ATAN( X / SQRT( (1-X)(1+X) ) ) ASINMAIN: fmov.s &0x3F800000,%fp1 fsub.x %fp0,%fp1 # 1-X fmovm.x &0x4,-(%sp) # {fp2} fmov.s &0x3F800000,%fp2 fadd.x %fp0,%fp2 # 1+X fmul.x %fp2,%fp1 # (1+X)(1-X) fmovm.x (%sp)+,&0x20 # {fp2} fsqrt.x %fp1 # SQRT([1-X][1+X]) fdiv.x %fp1,%fp0 # X/SQRT([1-X][1+X]) fmovm.x &0x01,-(%sp) # save X/SQRT(...) lea (%sp),%a0 # pass ptr to X/SQRT(...) bsr satan add.l &0xc,%sp # clear X/SQRT(...) from stack bra t_inx2 ASINBIG: fabs.x %fp0 # |X| fcmp.s %fp0,&0x3F800000 fbgt t_operr # cause an operr exception #--|X| = 1, ASIN(X) = +- PI/2. ASINONE: fmov.x PIBY2(%pc),%fp0 mov.l (%a0),%d1 and.l &0x80000000,%d1 # SIGN BIT OF X or.l &0x3F800000,%d1 # +-1 IN SGL FORMAT mov.l %d1,-(%sp) # push SIGN(X) IN SGL-FMT fmov.l %d0,%fpcr fmul.s (%sp)+,%fp0 bra t_inx2 #--|X| < 2^(-40), ATAN(X) = X ASINTINY: fmov.l %d0,%fpcr # restore users rnd mode,prec mov.b &FMOV_OP,%d1 # last inst is MOVE fmov.x (%a0),%fp0 # last inst - possible exception bra t_catch global sasind #--ASIN(X) = X FOR DENORMALIZED X sasind: bra t_extdnrm ######################################################################### # sacos(): computes the inverse cosine of a normalized input # # sacosd(): computes the inverse cosine of a denormalized input # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # d0 = round precision,mode # # # # OUTPUT ************************************************************** # # fp0 = arccos(X) # # # # ACCURACY and MONOTONICITY ******************************************* # # The returned result is within 3 ulps in 64 significant bit, # # i.e. within 0.5001 ulp to 53 bits if the result is subsequently # # rounded to double precision. The result is provably monotonic # # in double precision. # # # # ALGORITHM *********************************************************** # # # # ACOS # # 1. If |X| >= 1, go to 3. # # # # 2. (|X| < 1) Calculate acos(X) by # # z := (1-X) / (1+X) # # acos(X) = 2 * atan( sqrt(z) ). # # Exit. # # # # 3. If |X| > 1, go to 5. # # # # 4. (|X| = 1) If X > 0, return 0. Otherwise, return Pi. Exit. # # # # 5. (|X| > 1) Generate an invalid operation by 0 * infinity. # # Exit. # # # ######################################################################### global sacos sacos: fmov.x (%a0),%fp0 # LOAD INPUT mov.l (%a0),%d1 # pack exp w/ upper 16 fraction mov.w 4(%a0),%d1 and.l &0x7FFFFFFF,%d1 cmp.l %d1,&0x3FFF8000 bge.b ACOSBIG #--THIS IS THE USUAL CASE, |X| < 1 #--ACOS(X) = 2 * ATAN( SQRT( (1-X)/(1+X) ) ) ACOSMAIN: fmov.s &0x3F800000,%fp1 fadd.x %fp0,%fp1 # 1+X fneg.x %fp0 # -X fadd.s &0x3F800000,%fp0 # 1-X fdiv.x %fp1,%fp0 # (1-X)/(1+X) fsqrt.x %fp0 # SQRT((1-X)/(1+X)) mov.l %d0,-(%sp) # save original users fpcr clr.l %d0 fmovm.x &0x01,-(%sp) # save SQRT(...) to stack lea (%sp),%a0 # pass ptr to sqrt bsr satan # ATAN(SQRT([1-X]/[1+X])) add.l &0xc,%sp # clear SQRT(...) from stack fmov.l (%sp)+,%fpcr # restore users round prec,mode fadd.x %fp0,%fp0 # 2 * ATAN( STUFF ) bra t_pinx2 ACOSBIG: fabs.x %fp0 fcmp.s %fp0,&0x3F800000 fbgt t_operr # cause an operr exception #--|X| = 1, ACOS(X) = 0 OR PI tst.b (%a0) # is X positive or negative? bpl.b ACOSP1 #--X = -1 #Returns PI and inexact exception ACOSM1: fmov.x PI(%pc),%fp0 # load PI fmov.l %d0,%fpcr # load round mode,prec fadd.s &0x00800000,%fp0 # add a small value bra t_pinx2 ACOSP1: bra ld_pzero # answer is positive zero global sacosd #--ACOS(X) = PI/2 FOR DENORMALIZED X sacosd: fmov.l %d0,%fpcr # load user's rnd mode/prec fmov.x PIBY2(%pc),%fp0 bra t_pinx2 ######################################################################### # setox(): computes the exponential for a normalized input # # setoxd(): computes the exponential for a denormalized input # # setoxm1(): computes the exponential minus 1 for a normalized input # # setoxm1d(): computes the exponential minus 1 for a denormalized input # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # d0 = round precision,mode # # # # OUTPUT ************************************************************** # # fp0 = exp(X) or exp(X)-1 # # # # ACCURACY and MONOTONICITY ******************************************* # # The returned result is within 0.85 ulps in 64 significant bit, # # i.e. within 0.5001 ulp to 53 bits if the result is subsequently # # rounded to double precision. The result is provably monotonic # # in double precision. # # # # ALGORITHM and IMPLEMENTATION **************************************** # # # # setoxd # # ------ # # Step 1. Set ans := 1.0 # # # # Step 2. Return ans := ans + sign(X)*2^(-126). Exit. # # Notes: This will always generate one exception -- inexact. # # # # # # setox # # ----- # # # # Step 1. Filter out extreme cases of input argument. # # 1.1 If |X| >= 2^(-65), go to Step 1.3. # # 1.2 Go to Step 7. # # 1.3 If |X| < 16380 log(2), go to Step 2. # # 1.4 Go to Step 8. # # Notes: The usual case should take the branches 1.1 -> 1.3 -> 2.# # To avoid the use of floating-point comparisons, a # # compact representation of |X| is used. This format is a # # 32-bit integer, the upper (more significant) 16 bits # # are the sign and biased exponent field of |X|; the # # lower 16 bits are the 16 most significant fraction # # (including the explicit bit) bits of |X|. Consequently, # # the comparisons in Steps 1.1 and 1.3 can be performed # # by integer comparison. Note also that the constant # # 16380 log(2) used in Step 1.3 is also in the compact # # form. Thus taking the branch to Step 2 guarantees # # |X| < 16380 log(2). There is no harm to have a small # # number of cases where |X| is less than, but close to, # # 16380 log(2) and the branch to Step 9 is taken. # # # # Step 2. Calculate N = round-to-nearest-int( X * 64/log2 ). # # 2.1 Set AdjFlag := 0 (indicates the branch 1.3 -> 2 # # was taken) # # 2.2 N := round-to-nearest-integer( X * 64/log2 ). # # 2.3 Calculate J = N mod 64; so J = 0,1,2,..., # # or 63. # # 2.4 Calculate M = (N - J)/64; so N = 64M + J. # # 2.5 Calculate the address of the stored value of # # 2^(J/64). # # 2.6 Create the value Scale = 2^M. # # Notes: The calculation in 2.2 is really performed by # # Z := X * constant # # N := round-to-nearest-integer(Z) # # where # # constant := single-precision( 64/log 2 ). # # # # Using a single-precision constant avoids memory # # access. Another effect of using a single-precision # # "constant" is that the calculated value Z is # # # # Z = X*(64/log2)*(1+eps), |eps| <= 2^(-24). # # # # This error has to be considered later in Steps 3 and 4. # # # # Step 3. Calculate X - N*log2/64. # # 3.1 R := X + N*L1, # # where L1 := single-precision(-log2/64). # # 3.2 R := R + N*L2, # # L2 := extended-precision(-log2/64 - L1).# # Notes: a) The way L1 and L2 are chosen ensures L1+L2 # # approximate the value -log2/64 to 88 bits of accuracy. # # b) N*L1 is exact because N is no longer than 22 bits # # and L1 is no longer than 24 bits. # # c) The calculation X+N*L1 is also exact due to # # cancellation. Thus, R is practically X+N(L1+L2) to full # # 64 bits. # # d) It is important to estimate how large can |R| be # # after Step 3.2. # # # # N = rnd-to-int( X*64/log2 (1+eps) ), |eps|<=2^(-24) # # X*64/log2 (1+eps) = N + f, |f| <= 0.5 # # X*64/log2 - N = f - eps*X 64/log2 # # X - N*log2/64 = f*log2/64 - eps*X # # # # # # Now |X| <= 16446 log2, thus # # # # |X - N*log2/64| <= (0.5 + 16446/2^(18))*log2/64 # # <= 0.57 log2/64. # # This bound will be used in Step 4. # # # # Step 4. Approximate exp(R)-1 by a polynomial # # p = R + R*R*(A1 + R*(A2 + R*(A3 + R*(A4 + R*A5)))) # # Notes: a) In order to reduce memory access, the coefficients # # are made as "short" as possible: A1 (which is 1/2), A4 # # and A5 are single precision; A2 and A3 are double # # precision. # # b) Even with the restrictions above, # # |p - (exp(R)-1)| < 2^(-68.8) for all |R| <= 0.0062. # # Note that 0.0062 is slightly bigger than 0.57 log2/64. # # c) To fully utilize the pipeline, p is separated into # # two independent pieces of roughly equal complexities # # p = [ R + R*S*(A2 + S*A4) ] + # # [ S*(A1 + S*(A3 + S*A5)) ] # # where S = R*R. # # # # Step 5. Compute 2^(J/64)*exp(R) = 2^(J/64)*(1+p) by # # ans := T + ( T*p + t) # # where T and t are the stored values for 2^(J/64). # # Notes: 2^(J/64) is stored as T and t where T+t approximates # # 2^(J/64) to roughly 85 bits; T is in extended precision # # and t is in single precision. Note also that T is # # rounded to 62 bits so that the last two bits of T are # # zero. The reason for such a special form is that T-1, # # T-2, and T-8 will all be exact --- a property that will # # give much more accurate computation of the function # # EXPM1. # # # # Step 6. Reconstruction of exp(X) # # exp(X) = 2^M * 2^(J/64) * exp(R). # # 6.1 If AdjFlag = 0, go to 6.3 # # 6.2 ans := ans * AdjScale # # 6.3 Restore the user FPCR # # 6.4 Return ans := ans * Scale. Exit. # # Notes: If AdjFlag = 0, we have X = Mlog2 + Jlog2/64 + R, # # |M| <= 16380, and Scale = 2^M. Moreover, exp(X) will # # neither overflow nor underflow. If AdjFlag = 1, that # # means that # # X = (M1+M)log2 + Jlog2/64 + R, |M1+M| >= 16380. # # Hence, exp(X) may overflow or underflow or neither. # # When that is the case, AdjScale = 2^(M1) where M1 is # # approximately M. Thus 6.2 will never cause # # over/underflow. Possible exception in 6.4 is overflow # # or underflow. The inexact exception is not generated in # # 6.4. Although one can argue that the inexact flag # # should always be raised, to simulate that exception # # cost to much than the flag is worth in practical uses. # # # # Step 7. Return 1 + X. # # 7.1 ans := X # # 7.2 Restore user FPCR. # # 7.3 Return ans := 1 + ans. Exit # # Notes: For non-zero X, the inexact exception will always be # # raised by 7.3. That is the only exception raised by 7.3.# # Note also that we use the FMOVEM instruction to move X # # in Step 7.1 to avoid unnecessary trapping. (Although # # the FMOVEM may not seem relevant since X is normalized, # # the precaution will be useful in the library version of # # this code where the separate entry for denormalized # # inputs will be done away with.) # # # # Step 8. Handle exp(X) where |X| >= 16380log2. # # 8.1 If |X| > 16480 log2, go to Step 9. # # (mimic 2.2 - 2.6) # # 8.2 N := round-to-integer( X * 64/log2 ) # # 8.3 Calculate J = N mod 64, J = 0,1,...,63 # # 8.4 K := (N-J)/64, M1 := truncate(K/2), M = K-M1, # # AdjFlag := 1. # # 8.5 Calculate the address of the stored value # # 2^(J/64). # # 8.6 Create the values Scale = 2^M, AdjScale = 2^M1. # # 8.7 Go to Step 3. # # Notes: Refer to notes for 2.2 - 2.6. # # # # Step 9. Handle exp(X), |X| > 16480 log2. # # 9.1 If X < 0, go to 9.3 # # 9.2 ans := Huge, go to 9.4 # # 9.3 ans := Tiny. # # 9.4 Restore user FPCR. # # 9.5 Return ans := ans * ans. Exit. # # Notes: Exp(X) will surely overflow or underflow, depending on # # X's sign. "Huge" and "Tiny" are respectively large/tiny # # extended-precision numbers whose square over/underflow # # with an inexact result. Thus, 9.5 always raises the # # inexact together with either overflow or underflow. # # # # setoxm1d # # -------- # # # # Step 1. Set ans := 0 # # # # Step 2. Return ans := X + ans. Exit. # # Notes: This will return X with the appropriate rounding # # precision prescribed by the user FPCR. # # # # setoxm1 # # ------- # # # # Step 1. Check |X| # # 1.1 If |X| >= 1/4, go to Step 1.3. # # 1.2 Go to Step 7. # # 1.3 If |X| < 70 log(2), go to Step 2. # # 1.4 Go to Step 10. # # Notes: The usual case should take the branches 1.1 -> 1.3 -> 2.# # However, it is conceivable |X| can be small very often # # because EXPM1 is intended to evaluate exp(X)-1 # # accurately when |X| is small. For further details on # # the comparisons, see the notes on Step 1 of setox. # # # # Step 2. Calculate N = round-to-nearest-int( X * 64/log2 ). # # 2.1 N := round-to-nearest-integer( X * 64/log2 ). # # 2.2 Calculate J = N mod 64; so J = 0,1,2,..., # # or 63. # # 2.3 Calculate M = (N - J)/64; so N = 64M + J. # # 2.4 Calculate the address of the stored value of # # 2^(J/64). # # 2.5 Create the values Sc = 2^M and # # OnebySc := -2^(-M). # # Notes: See the notes on Step 2 of setox. # # # # Step 3. Calculate X - N*log2/64. # # 3.1 R := X + N*L1, # # where L1 := single-precision(-log2/64). # # 3.2 R := R + N*L2, # # L2 := extended-precision(-log2/64 - L1).# # Notes: Applying the analysis of Step 3 of setox in this case # # shows that |R| <= 0.0055 (note that |X| <= 70 log2 in # # this case). # # # # Step 4. Approximate exp(R)-1 by a polynomial # # p = R+R*R*(A1+R*(A2+R*(A3+R*(A4+R*(A5+R*A6))))) # # Notes: a) In order to reduce memory access, the coefficients # # are made as "short" as possible: A1 (which is 1/2), A5 # # and A6 are single precision; A2, A3 and A4 are double # # precision. # # b) Even with the restriction above, # # |p - (exp(R)-1)| < |R| * 2^(-72.7) # # for all |R| <= 0.0055. # # c) To fully utilize the pipeline, p is separated into # # two independent pieces of roughly equal complexity # # p = [ R*S*(A2 + S*(A4 + S*A6)) ] + # # [ R + S*(A1 + S*(A3 + S*A5)) ] # # where S = R*R. # # # # Step 5. Compute 2^(J/64)*p by # # p := T*p # # where T and t are the stored values for 2^(J/64). # # Notes: 2^(J/64) is stored as T and t where T+t approximates # # 2^(J/64) to roughly 85 bits; T is in extended precision # # and t is in single precision. Note also that T is # # rounded to 62 bits so that the last two bits of T are # # zero. The reason for such a special form is that T-1, # # T-2, and T-8 will all be exact --- a property that will # # be exploited in Step 6 below. The total relative error # # in p is no bigger than 2^(-67.7) compared to the final # # result. # # # # Step 6. Reconstruction of exp(X)-1 # # exp(X)-1 = 2^M * ( 2^(J/64) + p - 2^(-M) ). # # 6.1 If M <= 63, go to Step 6.3. # # 6.2 ans := T + (p + (t + OnebySc)). Go to 6.6 # # 6.3 If M >= -3, go to 6.5. # # 6.4 ans := (T + (p + t)) + OnebySc. Go to 6.6 # # 6.5 ans := (T + OnebySc) + (p + t). # # 6.6 Restore user FPCR. # # 6.7 Return ans := Sc * ans. Exit. # # Notes: The various arrangements of the expressions give # # accurate evaluations. # # # # Step 7. exp(X)-1 for |X| < 1/4. # # 7.1 If |X| >= 2^(-65), go to Step 9. # # 7.2 Go to Step 8. # # # # Step 8. Calculate exp(X)-1, |X| < 2^(-65). # # 8.1 If |X| < 2^(-16312), goto 8.3 # # 8.2 Restore FPCR; return ans := X - 2^(-16382). # # Exit. # # 8.3 X := X * 2^(140). # # 8.4 Restore FPCR; ans := ans - 2^(-16382). # # Return ans := ans*2^(140). Exit # # Notes: The idea is to return "X - tiny" under the user # # precision and rounding modes. To avoid unnecessary # # inefficiency, we stay away from denormalized numbers # # the best we can. For |X| >= 2^(-16312), the # # straightforward 8.2 generates the inexact exception as # # the case warrants. # # # # Step 9. Calculate exp(X)-1, |X| < 1/4, by a polynomial # # p = X + X*X*(B1 + X*(B2 + ... + X*B12)) # # Notes: a) In order to reduce memory access, the coefficients # # are made as "short" as possible: B1 (which is 1/2), B9 # # to B12 are single precision; B3 to B8 are double # # precision; and B2 is double extended. # # b) Even with the restriction above, # # |p - (exp(X)-1)| < |X| 2^(-70.6) # # for all |X| <= 0.251. # # Note that 0.251 is slightly bigger than 1/4. # # c) To fully preserve accuracy, the polynomial is # # computed as # # X + ( S*B1 + Q ) where S = X*X and # # Q = X*S*(B2 + X*(B3 + ... + X*B12)) # # d) To fully utilize the pipeline, Q is separated into # # two independent pieces of roughly equal complexity # # Q = [ X*S*(B2 + S*(B4 + ... + S*B12)) ] + # # [ S*S*(B3 + S*(B5 + ... + S*B11)) ] # # # # Step 10. Calculate exp(X)-1 for |X| >= 70 log 2. # # 10.1 If X >= 70log2 , exp(X) - 1 = exp(X) for all # # practical purposes. Therefore, go to Step 1 of setox. # # 10.2 If X <= -70log2, exp(X) - 1 = -1 for all practical # # purposes. # # ans := -1 # # Restore user FPCR # # Return ans := ans + 2^(-126). Exit. # # Notes: 10.2 will always create an inexact and return -1 + tiny # # in the user rounding precision and mode. # # # ######################################################################### L2: long 0x3FDC0000,0x82E30865,0x4361C4C6,0x00000000 EEXPA3: long 0x3FA55555,0x55554CC1 EEXPA2: long 0x3FC55555,0x55554A54 EM1A4: long 0x3F811111,0x11174385 EM1A3: long 0x3FA55555,0x55554F5A EM1A2: long 0x3FC55555,0x55555555,0x00000000,0x00000000 EM1B8: long 0x3EC71DE3,0xA5774682 EM1B7: long 0x3EFA01A0,0x19D7CB68 EM1B6: long 0x3F2A01A0,0x1A019DF3 EM1B5: long 0x3F56C16C,0x16C170E2 EM1B4: long 0x3F811111,0x11111111 EM1B3: long 0x3FA55555,0x55555555 EM1B2: long 0x3FFC0000,0xAAAAAAAA,0xAAAAAAAB long 0x00000000 TWO140: long 0x48B00000,0x00000000 TWON140: long 0x37300000,0x00000000 EEXPTBL: long 0x3FFF0000,0x80000000,0x00000000,0x00000000 long 0x3FFF0000,0x8164D1F3,0xBC030774,0x9F841A9B long 0x3FFF0000,0x82CD8698,0xAC2BA1D8,0x9FC1D5B9 long 0x3FFF0000,0x843A28C3,0xACDE4048,0xA0728369 long 0x3FFF0000,0x85AAC367,0xCC487B14,0x1FC5C95C long 0x3FFF0000,0x871F6196,0x9E8D1010,0x1EE85C9F long 0x3FFF0000,0x88980E80,0x92DA8528,0x9FA20729 long 0x3FFF0000,0x8A14D575,0x496EFD9C,0xA07BF9AF long 0x3FFF0000,0x8B95C1E3,0xEA8BD6E8,0xA0020DCF long 0x3FFF0000,0x8D1ADF5B,0x7E5BA9E4,0x205A63DA long 0x3FFF0000,0x8EA4398B,0x45CD53C0,0x1EB70051 long 0x3FFF0000,0x9031DC43,0x1466B1DC,0x1F6EB029 long 0x3FFF0000,0x91C3D373,0xAB11C338,0xA0781494 long 0x3FFF0000,0x935A2B2F,0x13E6E92C,0x9EB319B0 long 0x3FFF0000,0x94F4EFA8,0xFEF70960,0x2017457D long 0x3FFF0000,0x96942D37,0x20185A00,0x1F11D537 long 0x3FFF0000,0x9837F051,0x8DB8A970,0x9FB952DD long 0x3FFF0000,0x99E04593,0x20B7FA64,0x1FE43087 long 0x3FFF0000,0x9B8D39B9,0xD54E5538,0x1FA2A818 long 0x3FFF0000,0x9D3ED9A7,0x2CFFB750,0x1FDE494D long 0x3FFF0000,0x9EF53260,0x91A111AC,0x20504890 long 0x3FFF0000,0xA0B0510F,0xB9714FC4,0xA073691C long 0x3FFF0000,0xA2704303,0x0C496818,0x1F9B7A05 long 0x3FFF0000,0xA43515AE,0x09E680A0,0xA0797126 long 0x3FFF0000,0xA5FED6A9,0xB15138EC,0xA071A140 long 0x3FFF0000,0xA7CD93B4,0xE9653568,0x204F62DA long 0x3FFF0000,0xA9A15AB4,0xEA7C0EF8,0x1F283C4A long 0x3FFF0000,0xAB7A39B5,0xA93ED338,0x9F9A7FDC long 0x3FFF0000,0xAD583EEA,0x42A14AC8,0xA05B3FAC long 0x3FFF0000,0xAF3B78AD,0x690A4374,0x1FDF2610 long 0x3FFF0000,0xB123F581,0xD2AC2590,0x9F705F90 long 0x3FFF0000,0xB311C412,0xA9112488,0x201F678A long 0x3FFF0000,0xB504F333,0xF9DE6484,0x1F32FB13 long 0x3FFF0000,0xB6FD91E3,0x28D17790,0x20038B30 long 0x3FFF0000,0xB8FBAF47,0x62FB9EE8,0x200DC3CC long 0x3FFF0000,0xBAFF5AB2,0x133E45FC,0x9F8B2AE6 long 0x3FFF0000,0xBD08A39F,0x580C36C0,0xA02BBF70 long 0x3FFF0000,0xBF1799B6,0x7A731084,0xA00BF518 long 0x3FFF0000,0xC12C4CCA,0x66709458,0xA041DD41 long 0x3FFF0000,0xC346CCDA,0x24976408,0x9FDF137B long 0x3FFF0000,0xC5672A11,0x5506DADC,0x201F1568 long 0x3FFF0000,0xC78D74C8,0xABB9B15C,0x1FC13A2E long 0x3FFF0000,0xC9B9BD86,0x6E2F27A4,0xA03F8F03 long 0x3FFF0000,0xCBEC14FE,0xF2727C5C,0x1FF4907D long 0x3FFF0000,0xCE248C15,0x1F8480E4,0x9E6E53E4 long 0x3FFF0000,0xD06333DA,0xEF2B2594,0x1FD6D45C long 0x3FFF0000,0xD2A81D91,0xF12AE45C,0xA076EDB9 long 0x3FFF0000,0xD4F35AAB,0xCFEDFA20,0x9FA6DE21 long 0x3FFF0000,0xD744FCCA,0xD69D6AF4,0x1EE69A2F long 0x3FFF0000,0xD99D15C2,0x78AFD7B4,0x207F439F long 0x3FFF0000,0xDBFBB797,0xDAF23754,0x201EC207 long 0x3FFF0000,0xDE60F482,0x5E0E9124,0x9E8BE175 long 0x3FFF0000,0xE0CCDEEC,0x2A94E110,0x20032C4B long 0x3FFF0000,0xE33F8972,0xBE8A5A50,0x2004DFF5 long 0x3FFF0000,0xE5B906E7,0x7C8348A8,0x1E72F47A long 0x3FFF0000,0xE8396A50,0x3C4BDC68,0x1F722F22 long 0x3FFF0000,0xEAC0C6E7,0xDD243930,0xA017E945 long 0x3FFF0000,0xED4F301E,0xD9942B84,0x1F401A5B long 0x3FFF0000,0xEFE4B99B,0xDCDAF5CC,0x9FB9A9E3 long 0x3FFF0000,0xF281773C,0x59FFB138,0x20744C05 long 0x3FFF0000,0xF5257D15,0x2486CC2C,0x1F773A19 long 0x3FFF0000,0xF7D0DF73,0x0AD13BB8,0x1FFE90D5 long 0x3FFF0000,0xFA83B2DB,0x722A033C,0xA041ED22 long 0x3FFF0000,0xFD3E0C0C,0xF486C174,0x1F853F3A set ADJFLAG,L_SCR2 set SCALE,FP_SCR0 set ADJSCALE,FP_SCR1 set SC,FP_SCR0 set ONEBYSC,FP_SCR1 global setox setox: #--entry point for EXP(X), here X is finite, non-zero, and not NaN's #--Step 1. mov.l (%a0),%d1 # load part of input X and.l &0x7FFF0000,%d1 # biased expo. of X cmp.l %d1,&0x3FBE0000 # 2^(-65) bge.b EXPC1 # normal case bra EXPSM EXPC1: #--The case |X| >= 2^(-65) mov.w 4(%a0),%d1 # expo. and partial sig. of |X| cmp.l %d1,&0x400CB167 # 16380 log2 trunc. 16 bits blt.b EXPMAIN # normal case bra EEXPBIG EXPMAIN: #--Step 2. #--This is the normal branch: 2^(-65) <= |X| < 16380 log2. fmov.x (%a0),%fp0 # load input from (a0) fmov.x %fp0,%fp1 fmul.s &0x42B8AA3B,%fp0 # 64/log2 * X fmovm.x &0xc,-(%sp) # save fp2 {%fp2/%fp3} mov.l &0,ADJFLAG(%a6) fmov.l %fp0,%d1 # N = int( X * 64/log2 ) lea EEXPTBL(%pc),%a1 fmov.l %d1,%fp0 # convert to floating-format mov.l %d1,L_SCR1(%a6) # save N temporarily and.l &0x3F,%d1 # D0 is J = N mod 64 lsl.l &4,%d1 add.l %d1,%a1 # address of 2^(J/64) mov.l L_SCR1(%a6),%d1 asr.l &6,%d1 # D0 is M add.w &0x3FFF,%d1 # biased expo. of 2^(M) mov.w L2(%pc),L_SCR1(%a6) # prefetch L2, no need in CB EXPCONT1: #--Step 3. #--fp1,fp2 saved on the stack. fp0 is N, fp1 is X, #--a0 points to 2^(J/64), D0 is biased expo. of 2^(M) fmov.x %fp0,%fp2 fmul.s &0xBC317218,%fp0 # N * L1, L1 = lead(-log2/64) fmul.x L2(%pc),%fp2 # N * L2, L1+L2 = -log2/64 fadd.x %fp1,%fp0 # X + N*L1 fadd.x %fp2,%fp0 # fp0 is R, reduced arg. #--Step 4. #--WE NOW COMPUTE EXP(R)-1 BY A POLYNOMIAL #-- R + R*R*(A1 + R*(A2 + R*(A3 + R*(A4 + R*A5)))) #--TO FULLY UTILIZE THE PIPELINE, WE COMPUTE S = R*R #--[R+R*S*(A2+S*A4)] + [S*(A1+S*(A3+S*A5))] fmov.x %fp0,%fp1 fmul.x %fp1,%fp1 # fp1 IS S = R*R fmov.s &0x3AB60B70,%fp2 # fp2 IS A5 fmul.x %fp1,%fp2 # fp2 IS S*A5 fmov.x %fp1,%fp3 fmul.s &0x3C088895,%fp3 # fp3 IS S*A4 fadd.d EEXPA3(%pc),%fp2 # fp2 IS A3+S*A5 fadd.d EEXPA2(%pc),%fp3 # fp3 IS A2+S*A4 fmul.x %fp1,%fp2 # fp2 IS S*(A3+S*A5) mov.w %d1,SCALE(%a6) # SCALE is 2^(M) in extended mov.l &0x80000000,SCALE+4(%a6) clr.l SCALE+8(%a6) fmul.x %fp1,%fp3 # fp3 IS S*(A2+S*A4) fadd.s &0x3F000000,%fp2 # fp2 IS A1+S*(A3+S*A5) fmul.x %fp0,%fp3 # fp3 IS R*S*(A2+S*A4) fmul.x %fp1,%fp2 # fp2 IS S*(A1+S*(A3+S*A5)) fadd.x %fp3,%fp0 # fp0 IS R+R*S*(A2+S*A4), fmov.x (%a1)+,%fp1 # fp1 is lead. pt. of 2^(J/64) fadd.x %fp2,%fp0 # fp0 is EXP(R) - 1 #--Step 5 #--final reconstruction process #--EXP(X) = 2^M * ( 2^(J/64) + 2^(J/64)*(EXP(R)-1) ) fmul.x %fp1,%fp0 # 2^(J/64)*(Exp(R)-1) fmovm.x (%sp)+,&0x30 # fp2 restored {%fp2/%fp3} fadd.s (%a1),%fp0 # accurate 2^(J/64) fadd.x %fp1,%fp0 # 2^(J/64) + 2^(J/64)*... mov.l ADJFLAG(%a6),%d1 #--Step 6 tst.l %d1 beq.b NORMAL ADJUST: fmul.x ADJSCALE(%a6),%fp0 NORMAL: fmov.l %d0,%fpcr # restore user FPCR mov.b &FMUL_OP,%d1 # last inst is MUL fmul.x SCALE(%a6),%fp0 # multiply 2^(M) bra t_catch EXPSM: #--Step 7 fmovm.x (%a0),&0x80 # load X fmov.l %d0,%fpcr fadd.s &0x3F800000,%fp0 # 1+X in user mode bra t_pinx2 EEXPBIG: #--Step 8 cmp.l %d1,&0x400CB27C # 16480 log2 bgt.b EXP2BIG #--Steps 8.2 -- 8.6 fmov.x (%a0),%fp0 # load input from (a0) fmov.x %fp0,%fp1 fmul.s &0x42B8AA3B,%fp0 # 64/log2 * X fmovm.x &0xc,-(%sp) # save fp2 {%fp2/%fp3} mov.l &1,ADJFLAG(%a6) fmov.l %fp0,%d1 # N = int( X * 64/log2 ) lea EEXPTBL(%pc),%a1 fmov.l %d1,%fp0 # convert to floating-format mov.l %d1,L_SCR1(%a6) # save N temporarily and.l &0x3F,%d1 # D0 is J = N mod 64 lsl.l &4,%d1 add.l %d1,%a1 # address of 2^(J/64) mov.l L_SCR1(%a6),%d1 asr.l &6,%d1 # D0 is K mov.l %d1,L_SCR1(%a6) # save K temporarily asr.l &1,%d1 # D0 is M1 sub.l %d1,L_SCR1(%a6) # a1 is M add.w &0x3FFF,%d1 # biased expo. of 2^(M1) mov.w %d1,ADJSCALE(%a6) # ADJSCALE := 2^(M1) mov.l &0x80000000,ADJSCALE+4(%a6) clr.l ADJSCALE+8(%a6) mov.l L_SCR1(%a6),%d1 # D0 is M add.w &0x3FFF,%d1 # biased expo. of 2^(M) bra.w EXPCONT1 # go back to Step 3 EXP2BIG: #--Step 9 tst.b (%a0) # is X positive or negative? bmi t_unfl2 bra t_ovfl2 global setoxd setoxd: #--entry point for EXP(X), X is denormalized mov.l (%a0),-(%sp) andi.l &0x80000000,(%sp) ori.l &0x00800000,(%sp) # sign(X)*2^(-126) fmov.s &0x3F800000,%fp0 fmov.l %d0,%fpcr fadd.s (%sp)+,%fp0 bra t_pinx2 global setoxm1 setoxm1: #--entry point for EXPM1(X), here X is finite, non-zero, non-NaN #--Step 1. #--Step 1.1 mov.l (%a0),%d1 # load part of input X and.l &0x7FFF0000,%d1 # biased expo. of X cmp.l %d1,&0x3FFD0000 # 1/4 bge.b EM1CON1 # |X| >= 1/4 bra EM1SM EM1CON1: #--Step 1.3 #--The case |X| >= 1/4 mov.w 4(%a0),%d1 # expo. and partial sig. of |X| cmp.l %d1,&0x4004C215 # 70log2 rounded up to 16 bits ble.b EM1MAIN # 1/4 <= |X| <= 70log2 bra EM1BIG EM1MAIN: #--Step 2. #--This is the case: 1/4 <= |X| <= 70 log2. fmov.x (%a0),%fp0 # load input from (a0) fmov.x %fp0,%fp1 fmul.s &0x42B8AA3B,%fp0 # 64/log2 * X fmovm.x &0xc,-(%sp) # save fp2 {%fp2/%fp3} fmov.l %fp0,%d1 # N = int( X * 64/log2 ) lea EEXPTBL(%pc),%a1 fmov.l %d1,%fp0 # convert to floating-format mov.l %d1,L_SCR1(%a6) # save N temporarily and.l &0x3F,%d1 # D0 is J = N mod 64 lsl.l &4,%d1 add.l %d1,%a1 # address of 2^(J/64) mov.l L_SCR1(%a6),%d1 asr.l &6,%d1 # D0 is M mov.l %d1,L_SCR1(%a6) # save a copy of M #--Step 3. #--fp1,fp2 saved on the stack. fp0 is N, fp1 is X, #--a0 points to 2^(J/64), D0 and a1 both contain M fmov.x %fp0,%fp2 fmul.s &0xBC317218,%fp0 # N * L1, L1 = lead(-log2/64) fmul.x L2(%pc),%fp2 # N * L2, L1+L2 = -log2/64 fadd.x %fp1,%fp0 # X + N*L1 fadd.x %fp2,%fp0 # fp0 is R, reduced arg. add.w &0x3FFF,%d1 # D0 is biased expo. of 2^M #--Step 4. #--WE NOW COMPUTE EXP(R)-1 BY A POLYNOMIAL #-- R + R*R*(A1 + R*(A2 + R*(A3 + R*(A4 + R*(A5 + R*A6))))) #--TO FULLY UTILIZE THE PIPELINE, WE COMPUTE S = R*R #--[R*S*(A2+S*(A4+S*A6))] + [R+S*(A1+S*(A3+S*A5))] fmov.x %fp0,%fp1 fmul.x %fp1,%fp1 # fp1 IS S = R*R fmov.s &0x3950097B,%fp2 # fp2 IS a6 fmul.x %fp1,%fp2 # fp2 IS S*A6 fmov.x %fp1,%fp3 fmul.s &0x3AB60B6A,%fp3 # fp3 IS S*A5 fadd.d EM1A4(%pc),%fp2 # fp2 IS A4+S*A6 fadd.d EM1A3(%pc),%fp3 # fp3 IS A3+S*A5 mov.w %d1,SC(%a6) # SC is 2^(M) in extended mov.l &0x80000000,SC+4(%a6) clr.l SC+8(%a6) fmul.x %fp1,%fp2 # fp2 IS S*(A4+S*A6) mov.l L_SCR1(%a6),%d1 # D0 is M neg.w %d1 # D0 is -M fmul.x %fp1,%fp3 # fp3 IS S*(A3+S*A5) add.w &0x3FFF,%d1 # biased expo. of 2^(-M) fadd.d EM1A2(%pc),%fp2 # fp2 IS A2+S*(A4+S*A6) fadd.s &0x3F000000,%fp3 # fp3 IS A1+S*(A3+S*A5) fmul.x %fp1,%fp2 # fp2 IS S*(A2+S*(A4+S*A6)) or.w &0x8000,%d1 # signed/expo. of -2^(-M) mov.w %d1,ONEBYSC(%a6) # OnebySc is -2^(-M) mov.l &0x80000000,ONEBYSC+4(%a6) clr.l ONEBYSC+8(%a6) fmul.x %fp3,%fp1 # fp1 IS S*(A1+S*(A3+S*A5)) fmul.x %fp0,%fp2 # fp2 IS R*S*(A2+S*(A4+S*A6)) fadd.x %fp1,%fp0 # fp0 IS R+S*(A1+S*(A3+S*A5)) fadd.x %fp2,%fp0 # fp0 IS EXP(R)-1 fmovm.x (%sp)+,&0x30 # fp2 restored {%fp2/%fp3} #--Step 5 #--Compute 2^(J/64)*p fmul.x (%a1),%fp0 # 2^(J/64)*(Exp(R)-1) #--Step 6 #--Step 6.1 mov.l L_SCR1(%a6),%d1 # retrieve M cmp.l %d1,&63 ble.b MLE63 #--Step 6.2 M >= 64 fmov.s 12(%a1),%fp1 # fp1 is t fadd.x ONEBYSC(%a6),%fp1 # fp1 is t+OnebySc fadd.x %fp1,%fp0 # p+(t+OnebySc), fp1 released fadd.x (%a1),%fp0 # T+(p+(t+OnebySc)) bra EM1SCALE MLE63: #--Step 6.3 M <= 63 cmp.l %d1,&-3 bge.b MGEN3 MLTN3: #--Step 6.4 M <= -4 fadd.s 12(%a1),%fp0 # p+t fadd.x (%a1),%fp0 # T+(p+t) fadd.x ONEBYSC(%a6),%fp0 # OnebySc + (T+(p+t)) bra EM1SCALE MGEN3: #--Step 6.5 -3 <= M <= 63 fmov.x (%a1)+,%fp1 # fp1 is T fadd.s (%a1),%fp0 # fp0 is p+t fadd.x ONEBYSC(%a6),%fp1 # fp1 is T+OnebySc fadd.x %fp1,%fp0 # (T+OnebySc)+(p+t) EM1SCALE: #--Step 6.6 fmov.l %d0,%fpcr fmul.x SC(%a6),%fp0 bra t_inx2 EM1SM: #--Step 7 |X| < 1/4. cmp.l %d1,&0x3FBE0000 # 2^(-65) bge.b EM1POLY EM1TINY: #--Step 8 |X| < 2^(-65) cmp.l %d1,&0x00330000 # 2^(-16312) blt.b EM12TINY #--Step 8.2 mov.l &0x80010000,SC(%a6) # SC is -2^(-16382) mov.l &0x80000000,SC+4(%a6) clr.l SC+8(%a6) fmov.x (%a0),%fp0 fmov.l %d0,%fpcr mov.b &FADD_OP,%d1 # last inst is ADD fadd.x SC(%a6),%fp0 bra t_catch EM12TINY: #--Step 8.3 fmov.x (%a0),%fp0 fmul.d TWO140(%pc),%fp0 mov.l &0x80010000,SC(%a6) mov.l &0x80000000,SC+4(%a6) clr.l SC+8(%a6) fadd.x SC(%a6),%fp0 fmov.l %d0,%fpcr mov.b &FMUL_OP,%d1 # last inst is MUL fmul.d TWON140(%pc),%fp0 bra t_catch EM1POLY: #--Step 9 exp(X)-1 by a simple polynomial fmov.x (%a0),%fp0 # fp0 is X fmul.x %fp0,%fp0 # fp0 is S := X*X fmovm.x &0xc,-(%sp) # save fp2 {%fp2/%fp3} fmov.s &0x2F30CAA8,%fp1 # fp1 is B12 fmul.x %fp0,%fp1 # fp1 is S*B12 fmov.s &0x310F8290,%fp2 # fp2 is B11 fadd.s &0x32D73220,%fp1 # fp1 is B10+S*B12 fmul.x %fp0,%fp2 # fp2 is S*B11 fmul.x %fp0,%fp1 # fp1 is S*(B10 + ... fadd.s &0x3493F281,%fp2 # fp2 is B9+S*... fadd.d EM1B8(%pc),%fp1 # fp1 is B8+S*... fmul.x %fp0,%fp2 # fp2 is S*(B9+... fmul.x %fp0,%fp1 # fp1 is S*(B8+... fadd.d EM1B7(%pc),%fp2 # fp2 is B7+S*... fadd.d EM1B6(%pc),%fp1 # fp1 is B6+S*... fmul.x %fp0,%fp2 # fp2 is S*(B7+... fmul.x %fp0,%fp1 # fp1 is S*(B6+... fadd.d EM1B5(%pc),%fp2 # fp2 is B5+S*... fadd.d EM1B4(%pc),%fp1 # fp1 is B4+S*... fmul.x %fp0,%fp2 # fp2 is S*(B5+... fmul.x %fp0,%fp1 # fp1 is S*(B4+... fadd.d EM1B3(%pc),%fp2 # fp2 is B3+S*... fadd.x EM1B2(%pc),%fp1 # fp1 is B2+S*... fmul.x %fp0,%fp2 # fp2 is S*(B3+... fmul.x %fp0,%fp1 # fp1 is S*(B2+... fmul.x %fp0,%fp2 # fp2 is S*S*(B3+...) fmul.x (%a0),%fp1 # fp1 is X*S*(B2... fmul.s &0x3F000000,%fp0 # fp0 is S*B1 fadd.x %fp2,%fp1 # fp1 is Q fmovm.x (%sp)+,&0x30 # fp2 restored {%fp2/%fp3} fadd.x %fp1,%fp0 # fp0 is S*B1+Q fmov.l %d0,%fpcr fadd.x (%a0),%fp0 bra t_inx2 EM1BIG: #--Step 10 |X| > 70 log2 mov.l (%a0),%d1 cmp.l %d1,&0 bgt.w EXPC1 #--Step 10.2 fmov.s &0xBF800000,%fp0 # fp0 is -1 fmov.l %d0,%fpcr fadd.s &0x00800000,%fp0 # -1 + 2^(-126) bra t_minx2 global setoxm1d setoxm1d: #--entry point for EXPM1(X), here X is denormalized #--Step 0. bra t_extdnrm ######################################################################### # sgetexp(): returns the exponent portion of the input argument. # # The exponent bias is removed and the exponent value is # # returned as an extended precision number in fp0. # # sgetexpd(): handles denormalized numbers. # # # # sgetman(): extracts the mantissa of the input argument. The # # mantissa is converted to an extended precision number w/ # # an exponent of $3fff and is returned in fp0. The range of # # the result is [1.0 - 2.0). # # sgetmand(): handles denormalized numbers. # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # # # OUTPUT ************************************************************** # # fp0 = exponent(X) or mantissa(X) # # # ######################################################################### global sgetexp sgetexp: mov.w SRC_EX(%a0),%d0 # get the exponent bclr &0xf,%d0 # clear the sign bit subi.w &0x3fff,%d0 # subtract off the bias fmov.w %d0,%fp0 # return exp in fp0 blt.b sgetexpn # it's negative rts sgetexpn: mov.b &neg_bmask,FPSR_CC(%a6) # set 'N' ccode bit rts global sgetexpd sgetexpd: bsr.l norm # normalize neg.w %d0 # new exp = -(shft amt) subi.w &0x3fff,%d0 # subtract off the bias fmov.w %d0,%fp0 # return exp in fp0 mov.b &neg_bmask,FPSR_CC(%a6) # set 'N' ccode bit rts global sgetman sgetman: mov.w SRC_EX(%a0),%d0 # get the exp ori.w &0x7fff,%d0 # clear old exp bclr &0xe,%d0 # make it the new exp +-3fff # here, we build the result in a tmp location so as not to disturb the input mov.l SRC_HI(%a0),FP_SCR0_HI(%a6) # copy to tmp loc mov.l SRC_LO(%a0),FP_SCR0_LO(%a6) # copy to tmp loc mov.w %d0,FP_SCR0_EX(%a6) # insert new exponent fmov.x FP_SCR0(%a6),%fp0 # put new value back in fp0 bmi.b sgetmann # it's negative rts sgetmann: mov.b &neg_bmask,FPSR_CC(%a6) # set 'N' ccode bit rts # # For denormalized numbers, shift the mantissa until the j-bit = 1, # then load the exponent with +/1 $3fff. # global sgetmand sgetmand: bsr.l norm # normalize exponent bra.b sgetman ######################################################################### # scosh(): computes the hyperbolic cosine of a normalized input # # scoshd(): computes the hyperbolic cosine of a denormalized input # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # d0 = round precision,mode # # # # OUTPUT ************************************************************** # # fp0 = cosh(X) # # # # ACCURACY and MONOTONICITY ******************************************* # # The returned result is within 3 ulps in 64 significant bit, # # i.e. within 0.5001 ulp to 53 bits if the result is subsequently # # rounded to double precision. The result is provably monotonic # # in double precision. # # # # ALGORITHM *********************************************************** # # # # COSH # # 1. If |X| > 16380 log2, go to 3. # # # # 2. (|X| <= 16380 log2) Cosh(X) is obtained by the formulae # # y = |X|, z = exp(Y), and # # cosh(X) = (1/2)*( z + 1/z ). # # Exit. # # # # 3. (|X| > 16380 log2). If |X| > 16480 log2, go to 5. # # # # 4. (16380 log2 < |X| <= 16480 log2) # # cosh(X) = sign(X) * exp(|X|)/2. # # However, invoking exp(|X|) may cause premature # # overflow. Thus, we calculate sinh(X) as follows: # # Y := |X| # # Fact := 2**(16380) # # Y' := Y - 16381 log2 # # cosh(X) := Fact * exp(Y'). # # Exit. # # # # 5. (|X| > 16480 log2) sinh(X) must overflow. Return # # Huge*Huge to generate overflow and an infinity with # # the appropriate sign. Huge is the largest finite number # # in extended format. Exit. # # # ######################################################################### TWO16380: long 0x7FFB0000,0x80000000,0x00000000,0x00000000 global scosh scosh: fmov.x (%a0),%fp0 # LOAD INPUT mov.l (%a0),%d1 mov.w 4(%a0),%d1 and.l &0x7FFFFFFF,%d1 cmp.l %d1,&0x400CB167 bgt.b COSHBIG #--THIS IS THE USUAL CASE, |X| < 16380 LOG2 #--COSH(X) = (1/2) * ( EXP(X) + 1/EXP(X) ) fabs.x %fp0 # |X| mov.l %d0,-(%sp) clr.l %d0 fmovm.x &0x01,-(%sp) # save |X| to stack lea (%sp),%a0 # pass ptr to |X| bsr setox # FP0 IS EXP(|X|) add.l &0xc,%sp # erase |X| from stack fmul.s &0x3F000000,%fp0 # (1/2)EXP(|X|) mov.l (%sp)+,%d0 fmov.s &0x3E800000,%fp1 # (1/4) fdiv.x %fp0,%fp1 # 1/(2 EXP(|X|)) fmov.l %d0,%fpcr mov.b &FADD_OP,%d1 # last inst is ADD fadd.x %fp1,%fp0 bra t_catch COSHBIG: cmp.l %d1,&0x400CB2B3 bgt.b COSHHUGE fabs.x %fp0 fsub.d T1(%pc),%fp0 # (|X|-16381LOG2_LEAD) fsub.d T2(%pc),%fp0 # |X| - 16381 LOG2, ACCURATE mov.l %d0,-(%sp) clr.l %d0 fmovm.x &0x01,-(%sp) # save fp0 to stack lea (%sp),%a0 # pass ptr to fp0 bsr setox add.l &0xc,%sp # clear fp0 from stack mov.l (%sp)+,%d0 fmov.l %d0,%fpcr mov.b &FMUL_OP,%d1 # last inst is MUL fmul.x TWO16380(%pc),%fp0 bra t_catch COSHHUGE: bra t_ovfl2 global scoshd #--COSH(X) = 1 FOR DENORMALIZED X scoshd: fmov.s &0x3F800000,%fp0 fmov.l %d0,%fpcr fadd.s &0x00800000,%fp0 bra t_pinx2 ######################################################################### # ssinh(): computes the hyperbolic sine of a normalized input # # ssinhd(): computes the hyperbolic sine of a denormalized input # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # d0 = round precision,mode # # # # OUTPUT ************************************************************** # # fp0 = sinh(X) # # # # ACCURACY and MONOTONICITY ******************************************* # # The returned result is within 3 ulps in 64 significant bit, # # i.e. within 0.5001 ulp to 53 bits if the result is subsequently # # rounded to double precision. The result is provably monotonic # # in double precision. # # # # ALGORITHM *********************************************************** # # # # SINH # # 1. If |X| > 16380 log2, go to 3. # # # # 2. (|X| <= 16380 log2) Sinh(X) is obtained by the formula # # y = |X|, sgn = sign(X), and z = expm1(Y), # # sinh(X) = sgn*(1/2)*( z + z/(1+z) ). # # Exit. # # # # 3. If |X| > 16480 log2, go to 5. # # # # 4. (16380 log2 < |X| <= 16480 log2) # # sinh(X) = sign(X) * exp(|X|)/2. # # However, invoking exp(|X|) may cause premature overflow. # # Thus, we calculate sinh(X) as follows: # # Y := |X| # # sgn := sign(X) # # sgnFact := sgn * 2**(16380) # # Y' := Y - 16381 log2 # # sinh(X) := sgnFact * exp(Y'). # # Exit. # # # # 5. (|X| > 16480 log2) sinh(X) must overflow. Return # # sign(X)*Huge*Huge to generate overflow and an infinity with # # the appropriate sign. Huge is the largest finite number in # # extended format. Exit. # # # ######################################################################### global ssinh ssinh: fmov.x (%a0),%fp0 # LOAD INPUT mov.l (%a0),%d1 mov.w 4(%a0),%d1 mov.l %d1,%a1 # save (compacted) operand and.l &0x7FFFFFFF,%d1 cmp.l %d1,&0x400CB167 bgt.b SINHBIG #--THIS IS THE USUAL CASE, |X| < 16380 LOG2 #--Y = |X|, Z = EXPM1(Y), SINH(X) = SIGN(X)*(1/2)*( Z + Z/(1+Z) ) fabs.x %fp0 # Y = |X| movm.l &0x8040,-(%sp) # {a1/d0} fmovm.x &0x01,-(%sp) # save Y on stack lea (%sp),%a0 # pass ptr to Y clr.l %d0 bsr setoxm1 # FP0 IS Z = EXPM1(Y) add.l &0xc,%sp # clear Y from stack fmov.l &0,%fpcr movm.l (%sp)+,&0x0201 # {a1/d0} fmov.x %fp0,%fp1 fadd.s &0x3F800000,%fp1 # 1+Z fmov.x %fp0,-(%sp) fdiv.x %fp1,%fp0 # Z/(1+Z) mov.l %a1,%d1 and.l &0x80000000,%d1 or.l &0x3F000000,%d1 fadd.x (%sp)+,%fp0 mov.l %d1,-(%sp) fmov.l %d0,%fpcr mov.b &FMUL_OP,%d1 # last inst is MUL fmul.s (%sp)+,%fp0 # last fp inst - possible exceptions set bra t_catch SINHBIG: cmp.l %d1,&0x400CB2B3 bgt t_ovfl fabs.x %fp0 fsub.d T1(%pc),%fp0 # (|X|-16381LOG2_LEAD) mov.l &0,-(%sp) mov.l &0x80000000,-(%sp) mov.l %a1,%d1 and.l &0x80000000,%d1 or.l &0x7FFB0000,%d1 mov.l %d1,-(%sp) # EXTENDED FMT fsub.d T2(%pc),%fp0 # |X| - 16381 LOG2, ACCURATE mov.l %d0,-(%sp) clr.l %d0 fmovm.x &0x01,-(%sp) # save fp0 on stack lea (%sp),%a0 # pass ptr to fp0 bsr setox add.l &0xc,%sp # clear fp0 from stack mov.l (%sp)+,%d0 fmov.l %d0,%fpcr mov.b &FMUL_OP,%d1 # last inst is MUL fmul.x (%sp)+,%fp0 # possible exception bra t_catch global ssinhd #--SINH(X) = X FOR DENORMALIZED X ssinhd: bra t_extdnrm ######################################################################### # stanh(): computes the hyperbolic tangent of a normalized input # # stanhd(): computes the hyperbolic tangent of a denormalized input # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # d0 = round precision,mode # # # # OUTPUT ************************************************************** # # fp0 = tanh(X) # # # # ACCURACY and MONOTONICITY ******************************************* # # The returned result is within 3 ulps in 64 significant bit, # # i.e. within 0.5001 ulp to 53 bits if the result is subsequently # # rounded to double precision. The result is provably monotonic # # in double precision. # # # # ALGORITHM *********************************************************** # # # # TANH # # 1. If |X| >= (5/2) log2 or |X| <= 2**(-40), go to 3. # # # # 2. (2**(-40) < |X| < (5/2) log2) Calculate tanh(X) by # # sgn := sign(X), y := 2|X|, z := expm1(Y), and # # tanh(X) = sgn*( z/(2+z) ). # # Exit. # # # # 3. (|X| <= 2**(-40) or |X| >= (5/2) log2). If |X| < 1, # # go to 7. # # # # 4. (|X| >= (5/2) log2) If |X| >= 50 log2, go to 6. # # # # 5. ((5/2) log2 <= |X| < 50 log2) Calculate tanh(X) by # # sgn := sign(X), y := 2|X|, z := exp(Y), # # tanh(X) = sgn - [ sgn*2/(1+z) ]. # # Exit. # # # # 6. (|X| >= 50 log2) Tanh(X) = +-1 (round to nearest). Thus, we # # calculate Tanh(X) by # # sgn := sign(X), Tiny := 2**(-126), # # tanh(X) := sgn - sgn*Tiny. # # Exit. # # # # 7. (|X| < 2**(-40)). Tanh(X) = X. Exit. # # # ######################################################################### set X,FP_SCR0 set XFRAC,X+4 set SGN,L_SCR3 set V,FP_SCR0 global stanh stanh: fmov.x (%a0),%fp0 # LOAD INPUT fmov.x %fp0,X(%a6) mov.l (%a0),%d1 mov.w 4(%a0),%d1 mov.l %d1,X(%a6) and.l &0x7FFFFFFF,%d1 cmp.l %d1, &0x3fd78000 # is |X| < 2^(-40)? blt.w TANHBORS # yes cmp.l %d1, &0x3fffddce # is |X| > (5/2)LOG2? bgt.w TANHBORS # yes #--THIS IS THE USUAL CASE #--Y = 2|X|, Z = EXPM1(Y), TANH(X) = SIGN(X) * Z / (Z+2). mov.l X(%a6),%d1 mov.l %d1,SGN(%a6) and.l &0x7FFF0000,%d1 add.l &0x00010000,%d1 # EXPONENT OF 2|X| mov.l %d1,X(%a6) and.l &0x80000000,SGN(%a6) fmov.x X(%a6),%fp0 # FP0 IS Y = 2|X| mov.l %d0,-(%sp) clr.l %d0 fmovm.x &0x1,-(%sp) # save Y on stack lea (%sp),%a0 # pass ptr to Y bsr setoxm1 # FP0 IS Z = EXPM1(Y) add.l &0xc,%sp # clear Y from stack mov.l (%sp)+,%d0 fmov.x %fp0,%fp1 fadd.s &0x40000000,%fp1 # Z+2 mov.l SGN(%a6),%d1 fmov.x %fp1,V(%a6) eor.l %d1,V(%a6) fmov.l %d0,%fpcr # restore users round prec,mode fdiv.x V(%a6),%fp0 bra t_inx2 TANHBORS: cmp.l %d1,&0x3FFF8000 blt.w TANHSM cmp.l %d1,&0x40048AA1 bgt.w TANHHUGE #-- (5/2) LOG2 < |X| < 50 LOG2, #--TANH(X) = 1 - (2/[EXP(2X)+1]). LET Y = 2|X|, SGN = SIGN(X), #--TANH(X) = SGN - SGN*2/[EXP(Y)+1]. mov.l X(%a6),%d1 mov.l %d1,SGN(%a6) and.l &0x7FFF0000,%d1 add.l &0x00010000,%d1 # EXPO OF 2|X| mov.l %d1,X(%a6) # Y = 2|X| and.l &0x80000000,SGN(%a6) mov.l SGN(%a6),%d1 fmov.x X(%a6),%fp0 # Y = 2|X| mov.l %d0,-(%sp) clr.l %d0 fmovm.x &0x01,-(%sp) # save Y on stack lea (%sp),%a0 # pass ptr to Y bsr setox # FP0 IS EXP(Y) add.l &0xc,%sp # clear Y from stack mov.l (%sp)+,%d0 mov.l SGN(%a6),%d1 fadd.s &0x3F800000,%fp0 # EXP(Y)+1 eor.l &0xC0000000,%d1 # -SIGN(X)*2 fmov.s %d1,%fp1 # -SIGN(X)*2 IN SGL FMT fdiv.x %fp0,%fp1 # -SIGN(X)2 / [EXP(Y)+1 ] mov.l SGN(%a6),%d1 or.l &0x3F800000,%d1 # SGN fmov.s %d1,%fp0 # SGN IN SGL FMT fmov.l %d0,%fpcr # restore users round prec,mode mov.b &FADD_OP,%d1 # last inst is ADD fadd.x %fp1,%fp0 bra t_inx2 TANHSM: fmov.l %d0,%fpcr # restore users round prec,mode mov.b &FMOV_OP,%d1 # last inst is MOVE fmov.x X(%a6),%fp0 # last inst - possible exception set bra t_catch #---RETURN SGN(X) - SGN(X)EPS TANHHUGE: mov.l X(%a6),%d1 and.l &0x80000000,%d1 or.l &0x3F800000,%d1 fmov.s %d1,%fp0 and.l &0x80000000,%d1 eor.l &0x80800000,%d1 # -SIGN(X)*EPS fmov.l %d0,%fpcr # restore users round prec,mode fadd.s %d1,%fp0 bra t_inx2 global stanhd #--TANH(X) = X FOR DENORMALIZED X stanhd: bra t_extdnrm ######################################################################### # slogn(): computes the natural logarithm of a normalized input # # slognd(): computes the natural logarithm of a denormalized input # # slognp1(): computes the log(1+X) of a normalized input # # slognp1d(): computes the log(1+X) of a denormalized input # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # d0 = round precision,mode # # # # OUTPUT ************************************************************** # # fp0 = log(X) or log(1+X) # # # # ACCURACY and MONOTONICITY ******************************************* # # The returned result is within 2 ulps in 64 significant bit, # # i.e. within 0.5001 ulp to 53 bits if the result is subsequently # # rounded to double precision. The result is provably monotonic # # in double precision. # # # # ALGORITHM *********************************************************** # # LOGN: # # Step 1. If |X-1| < 1/16, approximate log(X) by an odd # # polynomial in u, where u = 2(X-1)/(X+1). Otherwise, # # move on to Step 2. # # # # Step 2. X = 2**k * Y where 1 <= Y < 2. Define F to be the first # # seven significant bits of Y plus 2**(-7), i.e. # # F = 1.xxxxxx1 in base 2 where the six "x" match those # # of Y. Note that |Y-F| <= 2**(-7). # # # # Step 3. Define u = (Y-F)/F. Approximate log(1+u) by a # # polynomial in u, log(1+u) = poly. # # # # Step 4. Reconstruct # # log(X) = log( 2**k * Y ) = k*log(2) + log(F) + log(1+u) # # by k*log(2) + (log(F) + poly). The values of log(F) are # # calculated beforehand and stored in the program. # # # # lognp1: # # Step 1: If |X| < 1/16, approximate log(1+X) by an odd # # polynomial in u where u = 2X/(2+X). Otherwise, move on # # to Step 2. # # # # Step 2: Let 1+X = 2**k * Y, where 1 <= Y < 2. Define F as done # # in Step 2 of the algorithm for LOGN and compute # # log(1+X) as k*log(2) + log(F) + poly where poly # # approximates log(1+u), u = (Y-F)/F. # # # # Implementation Notes: # # Note 1. There are 64 different possible values for F, thus 64 # # log(F)'s need to be tabulated. Moreover, the values of # # 1/F are also tabulated so that the division in (Y-F)/F # # can be performed by a multiplication. # # # # Note 2. In Step 2 of lognp1, in order to preserved accuracy, # # the value Y-F has to be calculated carefully when # # 1/2 <= X < 3/2. # # # # Note 3. To fully exploit the pipeline, polynomials are usually # # separated into two parts evaluated independently before # # being added up. # # # ######################################################################### LOGOF2: long 0x3FFE0000,0xB17217F7,0xD1CF79AC,0x00000000 one: long 0x3F800000 zero: long 0x00000000 infty: long 0x7F800000 negone: long 0xBF800000 LOGA6: long 0x3FC2499A,0xB5E4040B LOGA5: long 0xBFC555B5,0x848CB7DB LOGA4: long 0x3FC99999,0x987D8730 LOGA3: long 0xBFCFFFFF,0xFF6F7E97 LOGA2: long 0x3FD55555,0x555555A4 LOGA1: long 0xBFE00000,0x00000008 LOGB5: long 0x3F175496,0xADD7DAD6 LOGB4: long 0x3F3C71C2,0xFE80C7E0 LOGB3: long 0x3F624924,0x928BCCFF LOGB2: long 0x3F899999,0x999995EC LOGB1: long 0x3FB55555,0x55555555 TWO: long 0x40000000,0x00000000 LTHOLD: long 0x3f990000,0x80000000,0x00000000,0x00000000 LOGTBL: long 0x3FFE0000,0xFE03F80F,0xE03F80FE,0x00000000 long 0x3FF70000,0xFF015358,0x833C47E2,0x00000000 long 0x3FFE0000,0xFA232CF2,0x52138AC0,0x00000000 long 0x3FF90000,0xBDC8D83E,0xAD88D549,0x00000000 long 0x3FFE0000,0xF6603D98,0x0F6603DA,0x00000000 long 0x3FFA0000,0x9CF43DCF,0xF5EAFD48,0x00000000 long 0x3FFE0000,0xF2B9D648,0x0F2B9D65,0x00000000 long 0x3FFA0000,0xDA16EB88,0xCB8DF614,0x00000000 long 0x3FFE0000,0xEF2EB71F,0xC4345238,0x00000000 long 0x3FFB0000,0x8B29B775,0x1BD70743,0x00000000 long 0x3FFE0000,0xEBBDB2A5,0xC1619C8C,0x00000000 long 0x3FFB0000,0xA8D839F8,0x30C1FB49,0x00000000 long 0x3FFE0000,0xE865AC7B,0x7603A197,0x00000000 long 0x3FFB0000,0xC61A2EB1,0x8CD907AD,0x00000000 long 0x3FFE0000,0xE525982A,0xF70C880E,0x00000000 long 0x3FFB0000,0xE2F2A47A,0xDE3A18AF,0x00000000 long 0x3FFE0000,0xE1FC780E,0x1FC780E2,0x00000000 long 0x3FFB0000,0xFF64898E,0xDF55D551,0x00000000 long 0x3FFE0000,0xDEE95C4C,0xA037BA57,0x00000000 long 0x3FFC0000,0x8DB956A9,0x7B3D0148,0x00000000 long 0x3FFE0000,0xDBEB61EE,0xD19C5958,0x00000000 long 0x3FFC0000,0x9B8FE100,0xF47BA1DE,0x00000000 long 0x3FFE0000,0xD901B203,0x6406C80E,0x00000000 long 0x3FFC0000,0xA9372F1D,0x0DA1BD17,0x00000000 long 0x3FFE0000,0xD62B80D6,0x2B80D62C,0x00000000 long 0x3FFC0000,0xB6B07F38,0xCE90E46B,0x00000000 long 0x3FFE0000,0xD3680D36,0x80D3680D,0x00000000 long 0x3FFC0000,0xC3FD0329,0x06488481,0x00000000 long 0x3FFE0000,0xD0B69FCB,0xD2580D0B,0x00000000 long 0x3FFC0000,0xD11DE0FF,0x15AB18CA,0x00000000 long 0x3FFE0000,0xCE168A77,0x25080CE1,0x00000000 long 0x3FFC0000,0xDE1433A1,0x6C66B150,0x00000000 long 0x3FFE0000,0xCB8727C0,0x65C393E0,0x00000000 long 0x3FFC0000,0xEAE10B5A,0x7DDC8ADD,0x00000000 long 0x3FFE0000,0xC907DA4E,0x871146AD,0x00000000 long 0x3FFC0000,0xF7856E5E,0xE2C9B291,0x00000000 long 0x3FFE0000,0xC6980C69,0x80C6980C,0x00000000 long 0x3FFD0000,0x82012CA5,0xA68206D7,0x00000000 long 0x3FFE0000,0xC4372F85,0x5D824CA6,0x00000000 long 0x3FFD0000,0x882C5FCD,0x7256A8C5,0x00000000 long 0x3FFE0000,0xC1E4BBD5,0x95F6E947,0x00000000 long 0x3FFD0000,0x8E44C60B,0x4CCFD7DE,0x00000000 long 0x3FFE0000,0xBFA02FE8,0x0BFA02FF,0x00000000 long 0x3FFD0000,0x944AD09E,0xF4351AF6,0x00000000 long 0x3FFE0000,0xBD691047,0x07661AA3,0x00000000 long 0x3FFD0000,0x9A3EECD4,0xC3EAA6B2,0x00000000 long 0x3FFE0000,0xBB3EE721,0xA54D880C,0x00000000 long 0x3FFD0000,0xA0218434,0x353F1DE8,0x00000000 long 0x3FFE0000,0xB92143FA,0x36F5E02E,0x00000000 long 0x3FFD0000,0xA5F2FCAB,0xBBC506DA,0x00000000 long 0x3FFE0000,0xB70FBB5A,0x19BE3659,0x00000000 long 0x3FFD0000,0xABB3B8BA,0x2AD362A5,0x00000000 long 0x3FFE0000,0xB509E68A,0x9B94821F,0x00000000 long 0x3FFD0000,0xB1641795,0xCE3CA97B,0x00000000 long 0x3FFE0000,0xB30F6352,0x8917C80B,0x00000000 long 0x3FFD0000,0xB7047551,0x5D0F1C61,0x00000000 long 0x3FFE0000,0xB11FD3B8,0x0B11FD3C,0x00000000 long 0x3FFD0000,0xBC952AFE,0xEA3D13E1,0x00000000 long 0x3FFE0000,0xAF3ADDC6,0x80AF3ADE,0x00000000 long 0x3FFD0000,0xC2168ED0,0xF458BA4A,0x00000000 long 0x3FFE0000,0xAD602B58,0x0AD602B6,0x00000000 long 0x3FFD0000,0xC788F439,0xB3163BF1,0x00000000 long 0x3FFE0000,0xAB8F69E2,0x8359CD11,0x00000000 long 0x3FFD0000,0xCCECAC08,0xBF04565D,0x00000000 long 0x3FFE0000,0xA9C84A47,0xA07F5638,0x00000000 long 0x3FFD0000,0xD2420487,0x2DD85160,0x00000000 long 0x3FFE0000,0xA80A80A8,0x0A80A80B,0x00000000 long 0x3FFD0000,0xD7894992,0x3BC3588A,0x00000000 long 0x3FFE0000,0xA655C439,0x2D7B73A8,0x00000000 long 0x3FFD0000,0xDCC2C4B4,0x9887DACC,0x00000000 long 0x3FFE0000,0xA4A9CF1D,0x96833751,0x00000000 long 0x3FFD0000,0xE1EEBD3E,0x6D6A6B9E,0x00000000 long 0x3FFE0000,0xA3065E3F,0xAE7CD0E0,0x00000000 long 0x3FFD0000,0xE70D785C,0x2F9F5BDC,0x00000000 long 0x3FFE0000,0xA16B312E,0xA8FC377D,0x00000000 long 0x3FFD0000,0xEC1F392C,0x5179F283,0x00000000 long 0x3FFE0000,0x9FD809FD,0x809FD80A,0x00000000 long 0x3FFD0000,0xF12440D3,0xE36130E6,0x00000000 long 0x3FFE0000,0x9E4CAD23,0xDD5F3A20,0x00000000 long 0x3FFD0000,0xF61CCE92,0x346600BB,0x00000000 long 0x3FFE0000,0x9CC8E160,0xC3FB19B9,0x00000000 long 0x3FFD0000,0xFB091FD3,0x8145630A,0x00000000 long 0x3FFE0000,0x9B4C6F9E,0xF03A3CAA,0x00000000 long 0x3FFD0000,0xFFE97042,0xBFA4C2AD,0x00000000 long 0x3FFE0000,0x99D722DA,0xBDE58F06,0x00000000 long 0x3FFE0000,0x825EFCED,0x49369330,0x00000000 long 0x3FFE0000,0x9868C809,0x868C8098,0x00000000 long 0x3FFE0000,0x84C37A7A,0xB9A905C9,0x00000000 long 0x3FFE0000,0x97012E02,0x5C04B809,0x00000000 long 0x3FFE0000,0x87224C2E,0x8E645FB7,0x00000000 long 0x3FFE0000,0x95A02568,0x095A0257,0x00000000 long 0x3FFE0000,0x897B8CAC,0x9F7DE298,0x00000000 long 0x3FFE0000,0x94458094,0x45809446,0x00000000 long 0x3FFE0000,0x8BCF55DE,0xC4CD05FE,0x00000000 long 0x3FFE0000,0x92F11384,0x0497889C,0x00000000 long 0x3FFE0000,0x8E1DC0FB,0x89E125E5,0x00000000 long 0x3FFE0000,0x91A2B3C4,0xD5E6F809,0x00000000 long 0x3FFE0000,0x9066E68C,0x955B6C9B,0x00000000 long 0x3FFE0000,0x905A3863,0x3E06C43B,0x00000000 long 0x3FFE0000,0x92AADE74,0xC7BE59E0,0x00000000 long 0x3FFE0000,0x8F1779D9,0xFDC3A219,0x00000000 long 0x3FFE0000,0x94E9BFF6,0x15845643,0x00000000 long 0x3FFE0000,0x8DDA5202,0x37694809,0x00000000 long 0x3FFE0000,0x9723A1B7,0x20134203,0x00000000 long 0x3FFE0000,0x8CA29C04,0x6514E023,0x00000000 long 0x3FFE0000,0x995899C8,0x90EB8990,0x00000000 long 0x3FFE0000,0x8B70344A,0x139BC75A,0x00000000 long 0x3FFE0000,0x9B88BDAA,0x3A3DAE2F,0x00000000 long 0x3FFE0000,0x8A42F870,0x5669DB46,0x00000000 long 0x3FFE0000,0x9DB4224F,0xFFE1157C,0x00000000 long 0x3FFE0000,0x891AC73A,0xE9819B50,0x00000000 long 0x3FFE0000,0x9FDADC26,0x8B7A12DA,0x00000000 long 0x3FFE0000,0x87F78087,0xF78087F8,0x00000000 long 0x3FFE0000,0xA1FCFF17,0xCE733BD4,0x00000000 long 0x3FFE0000,0x86D90544,0x7A34ACC6,0x00000000 long 0x3FFE0000,0xA41A9E8F,0x5446FB9F,0x00000000 long 0x3FFE0000,0x85BF3761,0x2CEE3C9B,0x00000000 long 0x3FFE0000,0xA633CD7E,0x6771CD8B,0x00000000 long 0x3FFE0000,0x84A9F9C8,0x084A9F9D,0x00000000 long 0x3FFE0000,0xA8489E60,0x0B435A5E,0x00000000 long 0x3FFE0000,0x83993052,0x3FBE3368,0x00000000 long 0x3FFE0000,0xAA59233C,0xCCA4BD49,0x00000000 long 0x3FFE0000,0x828CBFBE,0xB9A020A3,0x00000000 long 0x3FFE0000,0xAC656DAE,0x6BCC4985,0x00000000 long 0x3FFE0000,0x81848DA8,0xFAF0D277,0x00000000 long 0x3FFE0000,0xAE6D8EE3,0x60BB2468,0x00000000 long 0x3FFE0000,0x80808080,0x80808081,0x00000000 long 0x3FFE0000,0xB07197A2,0x3C46C654,0x00000000 set ADJK,L_SCR1 set X,FP_SCR0 set XDCARE,X+2 set XFRAC,X+4 set F,FP_SCR1 set FFRAC,F+4 set KLOG2,FP_SCR0 set SAVEU,FP_SCR0 global slogn #--ENTRY POINT FOR LOG(X) FOR X FINITE, NON-ZERO, NOT NAN'S slogn: fmov.x (%a0),%fp0 # LOAD INPUT mov.l &0x00000000,ADJK(%a6) LOGBGN: #--FPCR SAVED AND CLEARED, INPUT IS 2^(ADJK)*FP0, FP0 CONTAINS #--A FINITE, NON-ZERO, NORMALIZED NUMBER. mov.l (%a0),%d1 mov.w 4(%a0),%d1 mov.l (%a0),X(%a6) mov.l 4(%a0),X+4(%a6) mov.l 8(%a0),X+8(%a6) cmp.l %d1,&0 # CHECK IF X IS NEGATIVE blt.w LOGNEG # LOG OF NEGATIVE ARGUMENT IS INVALID # X IS POSITIVE, CHECK IF X IS NEAR 1 cmp.l %d1,&0x3ffef07d # IS X < 15/16? blt.b LOGMAIN # YES cmp.l %d1,&0x3fff8841 # IS X > 17/16? ble.w LOGNEAR1 # NO LOGMAIN: #--THIS SHOULD BE THE USUAL CASE, X NOT VERY CLOSE TO 1 #--X = 2^(K) * Y, 1 <= Y < 2. THUS, Y = 1.XXXXXXXX....XX IN BINARY. #--WE DEFINE F = 1.XXXXXX1, I.E. FIRST 7 BITS OF Y AND ATTACH A 1. #--THE IDEA IS THAT LOG(X) = K*LOG2 + LOG(Y) #-- = K*LOG2 + LOG(F) + LOG(1 + (Y-F)/F). #--NOTE THAT U = (Y-F)/F IS VERY SMALL AND THUS APPROXIMATING #--LOG(1+U) CAN BE VERY EFFICIENT. #--ALSO NOTE THAT THE VALUE 1/F IS STORED IN A TABLE SO THAT NO #--DIVISION IS NEEDED TO CALCULATE (Y-F)/F. #--GET K, Y, F, AND ADDRESS OF 1/F. asr.l &8,%d1 asr.l &8,%d1 # SHIFTED 16 BITS, BIASED EXPO. OF X sub.l &0x3FFF,%d1 # THIS IS K add.l ADJK(%a6),%d1 # ADJUST K, ORIGINAL INPUT MAY BE DENORM. lea LOGTBL(%pc),%a0 # BASE ADDRESS OF 1/F AND LOG(F) fmov.l %d1,%fp1 # CONVERT K TO FLOATING-POINT FORMAT #--WHILE THE CONVERSION IS GOING ON, WE GET F AND ADDRESS OF 1/F mov.l &0x3FFF0000,X(%a6) # X IS NOW Y, I.E. 2^(-K)*X mov.l XFRAC(%a6),FFRAC(%a6) and.l &0xFE000000,FFRAC(%a6) # FIRST 7 BITS OF Y or.l &0x01000000,FFRAC(%a6) # GET F: ATTACH A 1 AT THE EIGHTH BIT mov.l FFRAC(%a6),%d1 # READY TO GET ADDRESS OF 1/F and.l &0x7E000000,%d1 asr.l &8,%d1 asr.l &8,%d1 asr.l &4,%d1 # SHIFTED 20, D0 IS THE DISPLACEMENT add.l %d1,%a0 # A0 IS THE ADDRESS FOR 1/F fmov.x X(%a6),%fp0 mov.l &0x3fff0000,F(%a6) clr.l F+8(%a6) fsub.x F(%a6),%fp0 # Y-F fmovm.x &0xc,-(%sp) # SAVE FP2-3 WHILE FP0 IS NOT READY #--SUMMARY: FP0 IS Y-F, A0 IS ADDRESS OF 1/F, FP1 IS K #--REGISTERS SAVED: FPCR, FP1, FP2 LP1CONT1: #--AN RE-ENTRY POINT FOR LOGNP1 fmul.x (%a0),%fp0 # FP0 IS U = (Y-F)/F fmul.x LOGOF2(%pc),%fp1 # GET K*LOG2 WHILE FP0 IS NOT READY fmov.x %fp0,%fp2 fmul.x %fp2,%fp2 # FP2 IS V=U*U fmov.x %fp1,KLOG2(%a6) # PUT K*LOG2 IN MEMEORY, FREE FP1 #--LOG(1+U) IS APPROXIMATED BY #--U + V*(A1+U*(A2+U*(A3+U*(A4+U*(A5+U*A6))))) WHICH IS #--[U + V*(A1+V*(A3+V*A5))] + [U*V*(A2+V*(A4+V*A6))] fmov.x %fp2,%fp3 fmov.x %fp2,%fp1 fmul.d LOGA6(%pc),%fp1 # V*A6 fmul.d LOGA5(%pc),%fp2 # V*A5 fadd.d LOGA4(%pc),%fp1 # A4+V*A6 fadd.d LOGA3(%pc),%fp2 # A3+V*A5 fmul.x %fp3,%fp1 # V*(A4+V*A6) fmul.x %fp3,%fp2 # V*(A3+V*A5) fadd.d LOGA2(%pc),%fp1 # A2+V*(A4+V*A6) fadd.d LOGA1(%pc),%fp2 # A1+V*(A3+V*A5) fmul.x %fp3,%fp1 # V*(A2+V*(A4+V*A6)) add.l &16,%a0 # ADDRESS OF LOG(F) fmul.x %fp3,%fp2 # V*(A1+V*(A3+V*A5)) fmul.x %fp0,%fp1 # U*V*(A2+V*(A4+V*A6)) fadd.x %fp2,%fp0 # U+V*(A1+V*(A3+V*A5)) fadd.x (%a0),%fp1 # LOG(F)+U*V*(A2+V*(A4+V*A6)) fmovm.x (%sp)+,&0x30 # RESTORE FP2-3 fadd.x %fp1,%fp0 # FP0 IS LOG(F) + LOG(1+U) fmov.l %d0,%fpcr fadd.x KLOG2(%a6),%fp0 # FINAL ADD bra t_inx2 LOGNEAR1: # if the input is exactly equal to one, then exit through ld_pzero. # if these 2 lines weren't here, the correct answer would be returned # but the INEX2 bit would be set. fcmp.b %fp0,&0x1 # is it equal to one? fbeq.l ld_pzero # yes #--REGISTERS SAVED: FPCR, FP1. FP0 CONTAINS THE INPUT. fmov.x %fp0,%fp1 fsub.s one(%pc),%fp1 # FP1 IS X-1 fadd.s one(%pc),%fp0 # FP0 IS X+1 fadd.x %fp1,%fp1 # FP1 IS 2(X-1) #--LOG(X) = LOG(1+U/2)-LOG(1-U/2) WHICH IS AN ODD POLYNOMIAL #--IN U, U = 2(X-1)/(X+1) = FP1/FP0 LP1CONT2: #--THIS IS AN RE-ENTRY POINT FOR LOGNP1 fdiv.x %fp0,%fp1 # FP1 IS U fmovm.x &0xc,-(%sp) # SAVE FP2-3 #--REGISTERS SAVED ARE NOW FPCR,FP1,FP2,FP3 #--LET V=U*U, W=V*V, CALCULATE #--U + U*V*(B1 + V*(B2 + V*(B3 + V*(B4 + V*B5)))) BY #--U + U*V*( [B1 + W*(B3 + W*B5)] + [V*(B2 + W*B4)] ) fmov.x %fp1,%fp0 fmul.x %fp0,%fp0 # FP0 IS V fmov.x %fp1,SAVEU(%a6) # STORE U IN MEMORY, FREE FP1 fmov.x %fp0,%fp1 fmul.x %fp1,%fp1 # FP1 IS W fmov.d LOGB5(%pc),%fp3 fmov.d LOGB4(%pc),%fp2 fmul.x %fp1,%fp3 # W*B5 fmul.x %fp1,%fp2 # W*B4 fadd.d LOGB3(%pc),%fp3 # B3+W*B5 fadd.d LOGB2(%pc),%fp2 # B2+W*B4 fmul.x %fp3,%fp1 # W*(B3+W*B5), FP3 RELEASED fmul.x %fp0,%fp2 # V*(B2+W*B4) fadd.d LOGB1(%pc),%fp1 # B1+W*(B3+W*B5) fmul.x SAVEU(%a6),%fp0 # FP0 IS U*V fadd.x %fp2,%fp1 # B1+W*(B3+W*B5) + V*(B2+W*B4), FP2 RELEASED fmovm.x (%sp)+,&0x30 # FP2-3 RESTORED fmul.x %fp1,%fp0 # U*V*( [B1+W*(B3+W*B5)] + [V*(B2+W*B4)] ) fmov.l %d0,%fpcr fadd.x SAVEU(%a6),%fp0 bra t_inx2 #--REGISTERS SAVED FPCR. LOG(-VE) IS INVALID LOGNEG: bra t_operr global slognd slognd: #--ENTRY POINT FOR LOG(X) FOR DENORMALIZED INPUT mov.l &-100,ADJK(%a6) # INPUT = 2^(ADJK) * FP0 #----normalize the input value by left shifting k bits (k to be determined #----below), adjusting exponent and storing -k to ADJK #----the value TWOTO100 is no longer needed. #----Note that this code assumes the denormalized input is NON-ZERO. movm.l &0x3f00,-(%sp) # save some registers {d2-d7} mov.l (%a0),%d3 # D3 is exponent of smallest norm. # mov.l 4(%a0),%d4 mov.l 8(%a0),%d5 # (D4,D5) is (Hi_X,Lo_X) clr.l %d2 # D2 used for holding K tst.l %d4 bne.b Hi_not0 Hi_0: mov.l %d5,%d4 clr.l %d5 mov.l &32,%d2 clr.l %d6 bfffo %d4{&0:&32},%d6 lsl.l %d6,%d4 add.l %d6,%d2 # (D3,D4,D5) is normalized mov.l %d3,X(%a6) mov.l %d4,XFRAC(%a6) mov.l %d5,XFRAC+4(%a6) neg.l %d2 mov.l %d2,ADJK(%a6) fmov.x X(%a6),%fp0 movm.l (%sp)+,&0xfc # restore registers {d2-d7} lea X(%a6),%a0 bra.w LOGBGN # begin regular log(X) Hi_not0: clr.l %d6 bfffo %d4{&0:&32},%d6 # find first 1 mov.l %d6,%d2 # get k lsl.l %d6,%d4 mov.l %d5,%d7 # a copy of D5 lsl.l %d6,%d5 neg.l %d6 add.l &32,%d6 lsr.l %d6,%d7 or.l %d7,%d4 # (D3,D4,D5) normalized mov.l %d3,X(%a6) mov.l %d4,XFRAC(%a6) mov.l %d5,XFRAC+4(%a6) neg.l %d2 mov.l %d2,ADJK(%a6) fmov.x X(%a6),%fp0 movm.l (%sp)+,&0xfc # restore registers {d2-d7} lea X(%a6),%a0 bra.w LOGBGN # begin regular log(X) global slognp1 #--ENTRY POINT FOR LOG(1+X) FOR X FINITE, NON-ZERO, NOT NAN'S slognp1: fmov.x (%a0),%fp0 # LOAD INPUT fabs.x %fp0 # test magnitude fcmp.x %fp0,LTHOLD(%pc) # compare with min threshold fbgt.w LP1REAL # if greater, continue fmov.l %d0,%fpcr mov.b &FMOV_OP,%d1 # last inst is MOVE fmov.x (%a0),%fp0 # return signed argument bra t_catch LP1REAL: fmov.x (%a0),%fp0 # LOAD INPUT mov.l &0x00000000,ADJK(%a6) fmov.x %fp0,%fp1 # FP1 IS INPUT Z fadd.s one(%pc),%fp0 # X := ROUND(1+Z) fmov.x %fp0,X(%a6) mov.w XFRAC(%a6),XDCARE(%a6) mov.l X(%a6),%d1 cmp.l %d1,&0 ble.w LP1NEG0 # LOG OF ZERO OR -VE cmp.l %d1,&0x3ffe8000 # IS BOUNDS [1/2,3/2]? blt.w LOGMAIN cmp.l %d1,&0x3fffc000 bgt.w LOGMAIN #--IF 1+Z > 3/2 OR 1+Z < 1/2, THEN X, WHICH IS ROUNDING 1+Z, #--CONTAINS AT LEAST 63 BITS OF INFORMATION OF Z. IN THAT CASE, #--SIMPLY INVOKE LOG(X) FOR LOG(1+Z). LP1NEAR1: #--NEXT SEE IF EXP(-1/16) < X < EXP(1/16) cmp.l %d1,&0x3ffef07d blt.w LP1CARE cmp.l %d1,&0x3fff8841 bgt.w LP1CARE LP1ONE16: #--EXP(-1/16) < X < EXP(1/16). LOG(1+Z) = LOG(1+U/2) - LOG(1-U/2) #--WHERE U = 2Z/(2+Z) = 2Z/(1+X). fadd.x %fp1,%fp1 # FP1 IS 2Z fadd.s one(%pc),%fp0 # FP0 IS 1+X #--U = FP1/FP0 bra.w LP1CONT2 LP1CARE: #--HERE WE USE THE USUAL TABLE DRIVEN APPROACH. CARE HAS TO BE #--TAKEN BECAUSE 1+Z CAN HAVE 67 BITS OF INFORMATION AND WE MUST #--PRESERVE ALL THE INFORMATION. BECAUSE 1+Z IS IN [1/2,3/2], #--THERE ARE ONLY TWO CASES. #--CASE 1: 1+Z < 1, THEN K = -1 AND Y-F = (2-F) + 2Z #--CASE 2: 1+Z > 1, THEN K = 0 AND Y-F = (1-F) + Z #--ON RETURNING TO LP1CONT1, WE MUST HAVE K IN FP1, ADDRESS OF #--(1/F) IN A0, Y-F IN FP0, AND FP2 SAVED. mov.l XFRAC(%a6),FFRAC(%a6) and.l &0xFE000000,FFRAC(%a6) or.l &0x01000000,FFRAC(%a6) # F OBTAINED cmp.l %d1,&0x3FFF8000 # SEE IF 1+Z > 1 bge.b KISZERO KISNEG1: fmov.s TWO(%pc),%fp0 mov.l &0x3fff0000,F(%a6) clr.l F+8(%a6) fsub.x F(%a6),%fp0 # 2-F mov.l FFRAC(%a6),%d1 and.l &0x7E000000,%d1 asr.l &8,%d1 asr.l &8,%d1 asr.l &4,%d1 # D0 CONTAINS DISPLACEMENT FOR 1/F fadd.x %fp1,%fp1 # GET 2Z fmovm.x &0xc,-(%sp) # SAVE FP2 {%fp2/%fp3} fadd.x %fp1,%fp0 # FP0 IS Y-F = (2-F)+2Z lea LOGTBL(%pc),%a0 # A0 IS ADDRESS OF 1/F add.l %d1,%a0 fmov.s negone(%pc),%fp1 # FP1 IS K = -1 bra.w LP1CONT1 KISZERO: fmov.s one(%pc),%fp0 mov.l &0x3fff0000,F(%a6) clr.l F+8(%a6) fsub.x F(%a6),%fp0 # 1-F mov.l FFRAC(%a6),%d1 and.l &0x7E000000,%d1 asr.l &8,%d1 asr.l &8,%d1 asr.l &4,%d1 fadd.x %fp1,%fp0 # FP0 IS Y-F fmovm.x &0xc,-(%sp) # FP2 SAVED {%fp2/%fp3} lea LOGTBL(%pc),%a0 add.l %d1,%a0 # A0 IS ADDRESS OF 1/F fmov.s zero(%pc),%fp1 # FP1 IS K = 0 bra.w LP1CONT1 LP1NEG0: #--FPCR SAVED. D0 IS X IN COMPACT FORM. cmp.l %d1,&0 blt.b LP1NEG LP1ZERO: fmov.s negone(%pc),%fp0 fmov.l %d0,%fpcr bra t_dz LP1NEG: fmov.s zero(%pc),%fp0 fmov.l %d0,%fpcr bra t_operr global slognp1d #--ENTRY POINT FOR LOG(1+Z) FOR DENORMALIZED INPUT # Simply return the denorm slognp1d: bra t_extdnrm ######################################################################### # satanh(): computes the inverse hyperbolic tangent of a norm input # # satanhd(): computes the inverse hyperbolic tangent of a denorm input # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # d0 = round precision,mode # # # # OUTPUT ************************************************************** # # fp0 = arctanh(X) # # # # ACCURACY and MONOTONICITY ******************************************* # # The returned result is within 3 ulps in 64 significant bit, # # i.e. within 0.5001 ulp to 53 bits if the result is subsequently # # rounded to double precision. The result is provably monotonic # # in double precision. # # # # ALGORITHM *********************************************************** # # # # ATANH # # 1. If |X| >= 1, go to 3. # # # # 2. (|X| < 1) Calculate atanh(X) by # # sgn := sign(X) # # y := |X| # # z := 2y/(1-y) # # atanh(X) := sgn * (1/2) * logp1(z) # # Exit. # # # # 3. If |X| > 1, go to 5. # # # # 4. (|X| = 1) Generate infinity with an appropriate sign and # # divide-by-zero by # # sgn := sign(X) # # atan(X) := sgn / (+0). # # Exit. # # # # 5. (|X| > 1) Generate an invalid operation by 0 * infinity. # # Exit. # # # ######################################################################### global satanh satanh: mov.l (%a0),%d1 mov.w 4(%a0),%d1 and.l &0x7FFFFFFF,%d1 cmp.l %d1,&0x3FFF8000 bge.b ATANHBIG #--THIS IS THE USUAL CASE, |X| < 1 #--Y = |X|, Z = 2Y/(1-Y), ATANH(X) = SIGN(X) * (1/2) * LOG1P(Z). fabs.x (%a0),%fp0 # Y = |X| fmov.x %fp0,%fp1 fneg.x %fp1 # -Y fadd.x %fp0,%fp0 # 2Y fadd.s &0x3F800000,%fp1 # 1-Y fdiv.x %fp1,%fp0 # 2Y/(1-Y) mov.l (%a0),%d1 and.l &0x80000000,%d1 or.l &0x3F000000,%d1 # SIGN(X)*HALF mov.l %d1,-(%sp) mov.l %d0,-(%sp) # save rnd prec,mode clr.l %d0 # pass ext prec,RN fmovm.x &0x01,-(%sp) # save Z on stack lea (%sp),%a0 # pass ptr to Z bsr slognp1 # LOG1P(Z) add.l &0xc,%sp # clear Z from stack mov.l (%sp)+,%d0 # fetch old prec,mode fmov.l %d0,%fpcr # load it mov.b &FMUL_OP,%d1 # last inst is MUL fmul.s (%sp)+,%fp0 bra t_catch ATANHBIG: fabs.x (%a0),%fp0 # |X| fcmp.s %fp0,&0x3F800000 fbgt t_operr bra t_dz global satanhd #--ATANH(X) = X FOR DENORMALIZED X satanhd: bra t_extdnrm ######################################################################### # slog10(): computes the base-10 logarithm of a normalized input # # slog10d(): computes the base-10 logarithm of a denormalized input # # slog2(): computes the base-2 logarithm of a normalized input # # slog2d(): computes the base-2 logarithm of a denormalized input # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # d0 = round precision,mode # # # # OUTPUT ************************************************************** # # fp0 = log_10(X) or log_2(X) # # # # ACCURACY and MONOTONICITY ******************************************* # # The returned result is within 1.7 ulps in 64 significant bit, # # i.e. within 0.5003 ulp to 53 bits if the result is subsequently # # rounded to double precision. The result is provably monotonic # # in double precision. # # # # ALGORITHM *********************************************************** # # # # slog10d: # # # # Step 0. If X < 0, create a NaN and raise the invalid operation # # flag. Otherwise, save FPCR in D1; set FpCR to default. # # Notes: Default means round-to-nearest mode, no floating-point # # traps, and precision control = double extended. # # # # Step 1. Call slognd to obtain Y = log(X), the natural log of X. # # Notes: Even if X is denormalized, log(X) is always normalized. # # # # Step 2. Compute log_10(X) = log(X) * (1/log(10)). # # 2.1 Restore the user FPCR # # 2.2 Return ans := Y * INV_L10. # # # # slog10: # # # # Step 0. If X < 0, create a NaN and raise the invalid operation # # flag. Otherwise, save FPCR in D1; set FpCR to default. # # Notes: Default means round-to-nearest mode, no floating-point # # traps, and precision control = double extended. # # # # Step 1. Call sLogN to obtain Y = log(X), the natural log of X. # # # # Step 2. Compute log_10(X) = log(X) * (1/log(10)). # # 2.1 Restore the user FPCR # # 2.2 Return ans := Y * INV_L10. # # # # sLog2d: # # # # Step 0. If X < 0, create a NaN and raise the invalid operation # # flag. Otherwise, save FPCR in D1; set FpCR to default. # # Notes: Default means round-to-nearest mode, no floating-point # # traps, and precision control = double extended. # # # # Step 1. Call slognd to obtain Y = log(X), the natural log of X. # # Notes: Even if X is denormalized, log(X) is always normalized. # # # # Step 2. Compute log_10(X) = log(X) * (1/log(2)). # # 2.1 Restore the user FPCR # # 2.2 Return ans := Y * INV_L2. # # # # sLog2: # # # # Step 0. If X < 0, create a NaN and raise the invalid operation # # flag. Otherwise, save FPCR in D1; set FpCR to default. # # Notes: Default means round-to-nearest mode, no floating-point # # traps, and precision control = double extended. # # # # Step 1. If X is not an integer power of two, i.e., X != 2^k, # # go to Step 3. # # # # Step 2. Return k. # # 2.1 Get integer k, X = 2^k. # # 2.2 Restore the user FPCR. # # 2.3 Return ans := convert-to-double-extended(k). # # # # Step 3. Call sLogN to obtain Y = log(X), the natural log of X. # # # # Step 4. Compute log_2(X) = log(X) * (1/log(2)). # # 4.1 Restore the user FPCR # # 4.2 Return ans := Y * INV_L2. # # # ######################################################################### INV_L10: long 0x3FFD0000,0xDE5BD8A9,0x37287195,0x00000000 INV_L2: long 0x3FFF0000,0xB8AA3B29,0x5C17F0BC,0x00000000 global slog10 #--entry point for Log10(X), X is normalized slog10: fmov.b &0x1,%fp0 fcmp.x %fp0,(%a0) # if operand == 1, fbeq.l ld_pzero # return an EXACT zero mov.l (%a0),%d1 blt.w invalid mov.l %d0,-(%sp) clr.l %d0 bsr slogn # log(X), X normal. fmov.l (%sp)+,%fpcr fmul.x INV_L10(%pc),%fp0 bra t_inx2 global slog10d #--entry point for Log10(X), X is denormalized slog10d: mov.l (%a0),%d1 blt.w invalid mov.l %d0,-(%sp) clr.l %d0 bsr slognd # log(X), X denorm. fmov.l (%sp)+,%fpcr fmul.x INV_L10(%pc),%fp0 bra t_minx2 global slog2 #--entry point for Log2(X), X is normalized slog2: mov.l (%a0),%d1 blt.w invalid mov.l 8(%a0),%d1 bne.b continue # X is not 2^k mov.l 4(%a0),%d1 and.l &0x7FFFFFFF,%d1 bne.b continue #--X = 2^k. mov.w (%a0),%d1 and.l &0x00007FFF,%d1 sub.l &0x3FFF,%d1 beq.l ld_pzero fmov.l %d0,%fpcr fmov.l %d1,%fp0 bra t_inx2 continue: mov.l %d0,-(%sp) clr.l %d0 bsr slogn # log(X), X normal. fmov.l (%sp)+,%fpcr fmul.x INV_L2(%pc),%fp0 bra t_inx2 invalid: bra t_operr global slog2d #--entry point for Log2(X), X is denormalized slog2d: mov.l (%a0),%d1 blt.w invalid mov.l %d0,-(%sp) clr.l %d0 bsr slognd # log(X), X denorm. fmov.l (%sp)+,%fpcr fmul.x INV_L2(%pc),%fp0 bra t_minx2 ######################################################################### # stwotox(): computes 2**X for a normalized input # # stwotoxd(): computes 2**X for a denormalized input # # stentox(): computes 10**X for a normalized input # # stentoxd(): computes 10**X for a denormalized input # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input # # d0 = round precision,mode # # # # OUTPUT ************************************************************** # # fp0 = 2**X or 10**X # # # # ACCURACY and MONOTONICITY ******************************************* # # The returned result is within 2 ulps in 64 significant bit, # # i.e. within 0.5001 ulp to 53 bits if the result is subsequently # # rounded to double precision. The result is provably monotonic # # in double precision. # # # # ALGORITHM *********************************************************** # # # # twotox # # 1. If |X| > 16480, go to ExpBig. # # # # 2. If |X| < 2**(-70), go to ExpSm. # # # # 3. Decompose X as X = N/64 + r where |r| <= 1/128. Furthermore # # decompose N as # # N = 64(M + M') + j, j = 0,1,2,...,63. # # # # 4. Overwrite r := r * log2. Then # # 2**X = 2**(M') * 2**(M) * 2**(j/64) * exp(r). # # Go to expr to compute that expression. # # # # tentox # # 1. If |X| > 16480*log_10(2) (base 10 log of 2), go to ExpBig. # # # # 2. If |X| < 2**(-70), go to ExpSm. # # # # 3. Set y := X*log_2(10)*64 (base 2 log of 10). Set # # N := round-to-int(y). Decompose N as # # N = 64(M + M') + j, j = 0,1,2,...,63. # # # # 4. Define r as # # r := ((X - N*L1)-N*L2) * L10 # # where L1, L2 are the leading and trailing parts of # # log_10(2)/64 and L10 is the natural log of 10. Then # # 10**X = 2**(M') * 2**(M) * 2**(j/64) * exp(r). # # Go to expr to compute that expression. # # # # expr # # 1. Fetch 2**(j/64) from table as Fact1 and Fact2. # # # # 2. Overwrite Fact1 and Fact2 by # # Fact1 := 2**(M) * Fact1 # # Fact2 := 2**(M) * Fact2 # # Thus Fact1 + Fact2 = 2**(M) * 2**(j/64). # # # # 3. Calculate P where 1 + P approximates exp(r): # # P = r + r*r*(A1+r*(A2+...+r*A5)). # # # # 4. Let AdjFact := 2**(M'). Return # # AdjFact * ( Fact1 + ((Fact1*P) + Fact2) ). # # Exit. # # # # ExpBig # # 1. Generate overflow by Huge * Huge if X > 0; otherwise, # # generate underflow by Tiny * Tiny. # # # # ExpSm # # 1. Return 1 + X. # # # ######################################################################### L2TEN64: long 0x406A934F,0x0979A371 # 64LOG10/LOG2 L10TWO1: long 0x3F734413,0x509F8000 # LOG2/64LOG10 L10TWO2: long 0xBFCD0000,0xC0219DC1,0xDA994FD2,0x00000000 LOG10: long 0x40000000,0x935D8DDD,0xAAA8AC17,0x00000000 LOG2: long 0x3FFE0000,0xB17217F7,0xD1CF79AC,0x00000000 EXPA5: long 0x3F56C16D,0x6F7BD0B2 EXPA4: long 0x3F811112,0x302C712C EXPA3: long 0x3FA55555,0x55554CC1 EXPA2: long 0x3FC55555,0x55554A54 EXPA1: long 0x3FE00000,0x00000000,0x00000000,0x00000000 TEXPTBL: long 0x3FFF0000,0x80000000,0x00000000,0x3F738000 long 0x3FFF0000,0x8164D1F3,0xBC030773,0x3FBEF7CA long 0x3FFF0000,0x82CD8698,0xAC2BA1D7,0x3FBDF8A9 long 0x3FFF0000,0x843A28C3,0xACDE4046,0x3FBCD7C9 long 0x3FFF0000,0x85AAC367,0xCC487B15,0xBFBDE8DA long 0x3FFF0000,0x871F6196,0x9E8D1010,0x3FBDE85C long 0x3FFF0000,0x88980E80,0x92DA8527,0x3FBEBBF1 long 0x3FFF0000,0x8A14D575,0x496EFD9A,0x3FBB80CA long 0x3FFF0000,0x8B95C1E3,0xEA8BD6E7,0xBFBA8373 long 0x3FFF0000,0x8D1ADF5B,0x7E5BA9E6,0xBFBE9670 long 0x3FFF0000,0x8EA4398B,0x45CD53C0,0x3FBDB700 long 0x3FFF0000,0x9031DC43,0x1466B1DC,0x3FBEEEB0 long 0x3FFF0000,0x91C3D373,0xAB11C336,0x3FBBFD6D long 0x3FFF0000,0x935A2B2F,0x13E6E92C,0xBFBDB319 long 0x3FFF0000,0x94F4EFA8,0xFEF70961,0x3FBDBA2B long 0x3FFF0000,0x96942D37,0x20185A00,0x3FBE91D5 long 0x3FFF0000,0x9837F051,0x8DB8A96F,0x3FBE8D5A long 0x3FFF0000,0x99E04593,0x20B7FA65,0xBFBCDE7B long 0x3FFF0000,0x9B8D39B9,0xD54E5539,0xBFBEBAAF long 0x3FFF0000,0x9D3ED9A7,0x2CFFB751,0xBFBD86DA long 0x3FFF0000,0x9EF53260,0x91A111AE,0xBFBEBEDD long 0x3FFF0000,0xA0B0510F,0xB9714FC2,0x3FBCC96E long 0x3FFF0000,0xA2704303,0x0C496819,0xBFBEC90B long 0x3FFF0000,0xA43515AE,0x09E6809E,0x3FBBD1DB long 0x3FFF0000,0xA5FED6A9,0xB15138EA,0x3FBCE5EB long 0x3FFF0000,0xA7CD93B4,0xE965356A,0xBFBEC274 long 0x3FFF0000,0xA9A15AB4,0xEA7C0EF8,0x3FBEA83C long 0x3FFF0000,0xAB7A39B5,0xA93ED337,0x3FBECB00 long 0x3FFF0000,0xAD583EEA,0x42A14AC6,0x3FBE9301 long 0x3FFF0000,0xAF3B78AD,0x690A4375,0xBFBD8367 long 0x3FFF0000,0xB123F581,0xD2AC2590,0xBFBEF05F long 0x3FFF0000,0xB311C412,0xA9112489,0x3FBDFB3C long 0x3FFF0000,0xB504F333,0xF9DE6484,0x3FBEB2FB long 0x3FFF0000,0xB6FD91E3,0x28D17791,0x3FBAE2CB long 0x3FFF0000,0xB8FBAF47,0x62FB9EE9,0x3FBCDC3C long 0x3FFF0000,0xBAFF5AB2,0x133E45FB,0x3FBEE9AA long 0x3FFF0000,0xBD08A39F,0x580C36BF,0xBFBEAEFD long 0x3FFF0000,0xBF1799B6,0x7A731083,0xBFBCBF51 long 0x3FFF0000,0xC12C4CCA,0x66709456,0x3FBEF88A long 0x3FFF0000,0xC346CCDA,0x24976407,0x3FBD83B2 long 0x3FFF0000,0xC5672A11,0x5506DADD,0x3FBDF8AB long 0x3FFF0000,0xC78D74C8,0xABB9B15D,0xBFBDFB17 long 0x3FFF0000,0xC9B9BD86,0x6E2F27A3,0xBFBEFE3C long 0x3FFF0000,0xCBEC14FE,0xF2727C5D,0xBFBBB6F8 long 0x3FFF0000,0xCE248C15,0x1F8480E4,0xBFBCEE53 long 0x3FFF0000,0xD06333DA,0xEF2B2595,0xBFBDA4AE long 0x3FFF0000,0xD2A81D91,0xF12AE45A,0x3FBC9124 long 0x3FFF0000,0xD4F35AAB,0xCFEDFA1F,0x3FBEB243 long 0x3FFF0000,0xD744FCCA,0xD69D6AF4,0x3FBDE69A long 0x3FFF0000,0xD99D15C2,0x78AFD7B6,0xBFB8BC61 long 0x3FFF0000,0xDBFBB797,0xDAF23755,0x3FBDF610 long 0x3FFF0000,0xDE60F482,0x5E0E9124,0xBFBD8BE1 long 0x3FFF0000,0xE0CCDEEC,0x2A94E111,0x3FBACB12 long 0x3FFF0000,0xE33F8972,0xBE8A5A51,0x3FBB9BFE long 0x3FFF0000,0xE5B906E7,0x7C8348A8,0x3FBCF2F4 long 0x3FFF0000,0xE8396A50,0x3C4BDC68,0x3FBEF22F long 0x3FFF0000,0xEAC0C6E7,0xDD24392F,0xBFBDBF4A long 0x3FFF0000,0xED4F301E,0xD9942B84,0x3FBEC01A long 0x3FFF0000,0xEFE4B99B,0xDCDAF5CB,0x3FBE8CAC long 0x3FFF0000,0xF281773C,0x59FFB13A,0xBFBCBB3F long 0x3FFF0000,0xF5257D15,0x2486CC2C,0x3FBEF73A long 0x3FFF0000,0xF7D0DF73,0x0AD13BB9,0xBFB8B795 long 0x3FFF0000,0xFA83B2DB,0x722A033A,0x3FBEF84B long 0x3FFF0000,0xFD3E0C0C,0xF486C175,0xBFBEF581 set INT,L_SCR1 set X,FP_SCR0 set XDCARE,X+2 set XFRAC,X+4 set ADJFACT,FP_SCR0 set FACT1,FP_SCR0 set FACT1HI,FACT1+4 set FACT1LOW,FACT1+8 set FACT2,FP_SCR1 set FACT2HI,FACT2+4 set FACT2LOW,FACT2+8 global stwotox #--ENTRY POINT FOR 2**(X), HERE X IS FINITE, NON-ZERO, AND NOT NAN'S stwotox: fmovm.x (%a0),&0x80 # LOAD INPUT mov.l (%a0),%d1 mov.w 4(%a0),%d1 fmov.x %fp0,X(%a6) and.l &0x7FFFFFFF,%d1 cmp.l %d1,&0x3FB98000 # |X| >= 2**(-70)? bge.b TWOOK1 bra.w EXPBORS TWOOK1: cmp.l %d1,&0x400D80C0 # |X| > 16480? ble.b TWOMAIN bra.w EXPBORS TWOMAIN: #--USUAL CASE, 2^(-70) <= |X| <= 16480 fmov.x %fp0,%fp1 fmul.s &0x42800000,%fp1 # 64 * X fmov.l %fp1,INT(%a6) # N = ROUND-TO-INT(64 X) mov.l %d2,-(%sp) lea TEXPTBL(%pc),%a1 # LOAD ADDRESS OF TABLE OF 2^(J/64) fmov.l INT(%a6),%fp1 # N --> FLOATING FMT mov.l INT(%a6),%d1 mov.l %d1,%d2 and.l &0x3F,%d1 # D0 IS J asl.l &4,%d1 # DISPLACEMENT FOR 2^(J/64) add.l %d1,%a1 # ADDRESS FOR 2^(J/64) asr.l &6,%d2 # d2 IS L, N = 64L + J mov.l %d2,%d1 asr.l &1,%d1 # D0 IS M sub.l %d1,%d2 # d2 IS M', N = 64(M+M') + J add.l &0x3FFF,%d2 #--SUMMARY: a1 IS ADDRESS FOR THE LEADING PORTION OF 2^(J/64), #--D0 IS M WHERE N = 64(M+M') + J. NOTE THAT |M| <= 16140 BY DESIGN. #--ADJFACT = 2^(M'). #--REGISTERS SAVED SO FAR ARE (IN ORDER) FPCR, D0, FP1, a1, AND FP2. fmovm.x &0x0c,-(%sp) # save fp2/fp3 fmul.s &0x3C800000,%fp1 # (1/64)*N mov.l (%a1)+,FACT1(%a6) mov.l (%a1)+,FACT1HI(%a6) mov.l (%a1)+,FACT1LOW(%a6) mov.w (%a1)+,FACT2(%a6) fsub.x %fp1,%fp0 # X - (1/64)*INT(64 X) mov.w (%a1)+,FACT2HI(%a6) clr.w FACT2HI+2(%a6) clr.l FACT2LOW(%a6) add.w %d1,FACT1(%a6) fmul.x LOG2(%pc),%fp0 # FP0 IS R add.w %d1,FACT2(%a6) bra.w expr EXPBORS: #--FPCR, D0 SAVED cmp.l %d1,&0x3FFF8000 bgt.b TEXPBIG #--|X| IS SMALL, RETURN 1 + X fmov.l %d0,%fpcr # restore users round prec,mode fadd.s &0x3F800000,%fp0 # RETURN 1 + X bra t_pinx2 TEXPBIG: #--|X| IS LARGE, GENERATE OVERFLOW IF X > 0; ELSE GENERATE UNDERFLOW #--REGISTERS SAVE SO FAR ARE FPCR AND D0 mov.l X(%a6),%d1 cmp.l %d1,&0 blt.b EXPNEG bra t_ovfl2 # t_ovfl expects positive value EXPNEG: bra t_unfl2 # t_unfl expects positive value global stwotoxd stwotoxd: #--ENTRY POINT FOR 2**(X) FOR DENORMALIZED ARGUMENT fmov.l %d0,%fpcr # set user's rounding mode/precision fmov.s &0x3F800000,%fp0 # RETURN 1 + X mov.l (%a0),%d1 or.l &0x00800001,%d1 fadd.s %d1,%fp0 bra t_pinx2 global stentox #--ENTRY POINT FOR 10**(X), HERE X IS FINITE, NON-ZERO, AND NOT NAN'S stentox: fmovm.x (%a0),&0x80 # LOAD INPUT mov.l (%a0),%d1 mov.w 4(%a0),%d1 fmov.x %fp0,X(%a6) and.l &0x7FFFFFFF,%d1 cmp.l %d1,&0x3FB98000 # |X| >= 2**(-70)? bge.b TENOK1 bra.w EXPBORS TENOK1: cmp.l %d1,&0x400B9B07 # |X| <= 16480*log2/log10 ? ble.b TENMAIN bra.w EXPBORS TENMAIN: #--USUAL CASE, 2^(-70) <= |X| <= 16480 LOG 2 / LOG 10 fmov.x %fp0,%fp1 fmul.d L2TEN64(%pc),%fp1 # X*64*LOG10/LOG2 fmov.l %fp1,INT(%a6) # N=INT(X*64*LOG10/LOG2) mov.l %d2,-(%sp) lea TEXPTBL(%pc),%a1 # LOAD ADDRESS OF TABLE OF 2^(J/64) fmov.l INT(%a6),%fp1 # N --> FLOATING FMT mov.l INT(%a6),%d1 mov.l %d1,%d2 and.l &0x3F,%d1 # D0 IS J asl.l &4,%d1 # DISPLACEMENT FOR 2^(J/64) add.l %d1,%a1 # ADDRESS FOR 2^(J/64) asr.l &6,%d2 # d2 IS L, N = 64L + J mov.l %d2,%d1 asr.l &1,%d1 # D0 IS M sub.l %d1,%d2 # d2 IS M', N = 64(M+M') + J add.l &0x3FFF,%d2 #--SUMMARY: a1 IS ADDRESS FOR THE LEADING PORTION OF 2^(J/64), #--D0 IS M WHERE N = 64(M+M') + J. NOTE THAT |M| <= 16140 BY DESIGN. #--ADJFACT = 2^(M'). #--REGISTERS SAVED SO FAR ARE (IN ORDER) FPCR, D0, FP1, a1, AND FP2. fmovm.x &0x0c,-(%sp) # save fp2/fp3 fmov.x %fp1,%fp2 fmul.d L10TWO1(%pc),%fp1 # N*(LOG2/64LOG10)_LEAD mov.l (%a1)+,FACT1(%a6) fmul.x L10TWO2(%pc),%fp2 # N*(LOG2/64LOG10)_TRAIL mov.l (%a1)+,FACT1HI(%a6) mov.l (%a1)+,FACT1LOW(%a6) fsub.x %fp1,%fp0 # X - N L_LEAD mov.w (%a1)+,FACT2(%a6) fsub.x %fp2,%fp0 # X - N L_TRAIL mov.w (%a1)+,FACT2HI(%a6) clr.w FACT2HI+2(%a6) clr.l FACT2LOW(%a6) fmul.x LOG10(%pc),%fp0 # FP0 IS R add.w %d1,FACT1(%a6) add.w %d1,FACT2(%a6) expr: #--FPCR, FP2, FP3 ARE SAVED IN ORDER AS SHOWN. #--ADJFACT CONTAINS 2**(M'), FACT1 + FACT2 = 2**(M) * 2**(J/64). #--FP0 IS R. THE FOLLOWING CODE COMPUTES #-- 2**(M'+M) * 2**(J/64) * EXP(R) fmov.x %fp0,%fp1 fmul.x %fp1,%fp1 # FP1 IS S = R*R fmov.d EXPA5(%pc),%fp2 # FP2 IS A5 fmov.d EXPA4(%pc),%fp3 # FP3 IS A4 fmul.x %fp1,%fp2 # FP2 IS S*A5 fmul.x %fp1,%fp3 # FP3 IS S*A4 fadd.d EXPA3(%pc),%fp2 # FP2 IS A3+S*A5 fadd.d EXPA2(%pc),%fp3 # FP3 IS A2+S*A4 fmul.x %fp1,%fp2 # FP2 IS S*(A3+S*A5) fmul.x %fp1,%fp3 # FP3 IS S*(A2+S*A4) fadd.d EXPA1(%pc),%fp2 # FP2 IS A1+S*(A3+S*A5) fmul.x %fp0,%fp3 # FP3 IS R*S*(A2+S*A4) fmul.x %fp1,%fp2 # FP2 IS S*(A1+S*(A3+S*A5)) fadd.x %fp3,%fp0 # FP0 IS R+R*S*(A2+S*A4) fadd.x %fp2,%fp0 # FP0 IS EXP(R) - 1 fmovm.x (%sp)+,&0x30 # restore fp2/fp3 #--FINAL RECONSTRUCTION PROCESS #--EXP(X) = 2^M*2^(J/64) + 2^M*2^(J/64)*(EXP(R)-1) - (1 OR 0) fmul.x FACT1(%a6),%fp0 fadd.x FACT2(%a6),%fp0 fadd.x FACT1(%a6),%fp0 fmov.l %d0,%fpcr # restore users round prec,mode mov.w %d2,ADJFACT(%a6) # INSERT EXPONENT mov.l (%sp)+,%d2 mov.l &0x80000000,ADJFACT+4(%a6) clr.l ADJFACT+8(%a6) mov.b &FMUL_OP,%d1 # last inst is MUL fmul.x ADJFACT(%a6),%fp0 # FINAL ADJUSTMENT bra t_catch global stentoxd stentoxd: #--ENTRY POINT FOR 10**(X) FOR DENORMALIZED ARGUMENT fmov.l %d0,%fpcr # set user's rounding mode/precision fmov.s &0x3F800000,%fp0 # RETURN 1 + X mov.l (%a0),%d1 or.l &0x00800001,%d1 fadd.s %d1,%fp0 bra t_pinx2 ######################################################################### # sscale(): computes the destination operand scaled by the source # # operand. If the absoulute value of the source operand is # # >= 2^14, an overflow or underflow is returned. # # # # INPUT *************************************************************** # # a0 = pointer to double-extended source operand X # # a1 = pointer to double-extended destination operand Y # # # # OUTPUT ************************************************************** # # fp0 = scale(X,Y) # # # ######################################################################### set SIGN, L_SCR1 global sscale sscale: mov.l %d0,-(%sp) # store off ctrl bits for now mov.w DST_EX(%a1),%d1 # get dst exponent smi.b SIGN(%a6) # use SIGN to hold dst sign andi.l &0x00007fff,%d1 # strip sign from dst exp mov.w SRC_EX(%a0),%d0 # check src bounds andi.w &0x7fff,%d0 # clr src sign bit cmpi.w %d0,&0x3fff # is src ~ ZERO? blt.w src_small # yes cmpi.w %d0,&0x400c # no; is src too big? bgt.w src_out # yes # # Source is within 2^14 range. # src_ok: fintrz.x SRC(%a0),%fp0 # calc int of src fmov.l %fp0,%d0 # int src to d0 # don't want any accrued bits from the fintrz showing up later since # we may need to read the fpsr for the last fp op in t_catch2(). fmov.l &0x0,%fpsr tst.b DST_HI(%a1) # is dst denormalized? bmi.b sok_norm # the dst is a DENORM. normalize the DENORM and add the adjustment to # the src value. then, jump to the norm part of the routine. sok_dnrm: mov.l %d0,-(%sp) # save src for now mov.w DST_EX(%a1),FP_SCR0_EX(%a6) # make a copy mov.l DST_HI(%a1),FP_SCR0_HI(%a6) mov.l DST_LO(%a1),FP_SCR0_LO(%a6) lea FP_SCR0(%a6),%a0 # pass ptr to DENORM bsr.l norm # normalize the DENORM neg.l %d0 add.l (%sp)+,%d0 # add adjustment to src fmovm.x FP_SCR0(%a6),&0x80 # load normalized DENORM cmpi.w %d0,&-0x3fff # is the shft amt really low? bge.b sok_norm2 # thank goodness no # the multiply factor that we're trying to create should be a denorm # for the multiply to work. therefore, we're going to actually do a # multiply with a denorm which will cause an unimplemented data type # exception to be put into the machine which will be caught and corrected # later. we don't do this with the DENORMs above because this method # is slower. but, don't fret, I don't see it being used much either. fmov.l (%sp)+,%fpcr # restore user fpcr mov.l &0x80000000,%d1 # load normalized mantissa subi.l &-0x3fff,%d0 # how many should we shift? neg.l %d0 # make it positive cmpi.b %d0,&0x20 # is it > 32? bge.b sok_dnrm_32 # yes lsr.l %d0,%d1 # no; bit stays in upper lw clr.l -(%sp) # insert zero low mantissa mov.l %d1,-(%sp) # insert new high mantissa clr.l -(%sp) # make zero exponent bra.b sok_norm_cont sok_dnrm_32: subi.b &0x20,%d0 # get shift count lsr.l %d0,%d1 # make low mantissa longword mov.l %d1,-(%sp) # insert new low mantissa clr.l -(%sp) # insert zero high mantissa clr.l -(%sp) # make zero exponent bra.b sok_norm_cont # the src will force the dst to a DENORM value or worse. so, let's # create an fp multiply that will create the result. sok_norm: fmovm.x DST(%a1),&0x80 # load fp0 with normalized src sok_norm2: fmov.l (%sp)+,%fpcr # restore user fpcr addi.w &0x3fff,%d0 # turn src amt into exp value swap %d0 # put exponent in high word clr.l -(%sp) # insert new exponent mov.l &0x80000000,-(%sp) # insert new high mantissa mov.l %d0,-(%sp) # insert new lo mantissa sok_norm_cont: fmov.l %fpcr,%d0 # d0 needs fpcr for t_catch2 mov.b &FMUL_OP,%d1 # last inst is MUL fmul.x (%sp)+,%fp0 # do the multiply bra t_catch2 # catch any exceptions # # Source is outside of 2^14 range. Test the sign and branch # to the appropriate exception handler. # src_out: mov.l (%sp)+,%d0 # restore ctrl bits exg %a0,%a1 # swap src,dst ptrs tst.b SRC_EX(%a1) # is src negative? bmi t_unfl # yes; underflow bra t_ovfl_sc # no; overflow # # The source input is below 1, so we check for denormalized numbers # and set unfl. # src_small: tst.b DST_HI(%a1) # is dst denormalized? bpl.b ssmall_done # yes mov.l (%sp)+,%d0 fmov.l %d0,%fpcr # no; load control bits mov.b &FMOV_OP,%d1 # last inst is MOVE fmov.x DST(%a1),%fp0 # simply return dest bra t_catch2 ssmall_done: mov.l (%sp)+,%d0 # load control bits into d1 mov.l %a1,%a0 # pass ptr to dst bra t_resdnrm ######################################################################### # smod(): computes the fp MOD of the input values X,Y. # # srem(): computes the fp (IEEE) REM of the input values X,Y. # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input X # # a1 = pointer to extended precision input Y # # d0 = round precision,mode # # # # The input operands X and Y can be either normalized or # # denormalized. # # # # OUTPUT ************************************************************** # # fp0 = FREM(X,Y) or FMOD(X,Y) # # # # ALGORITHM *********************************************************** # # # # Step 1. Save and strip signs of X and Y: signX := sign(X), # # signY := sign(Y), X := |X|, Y := |Y|, # # signQ := signX EOR signY. Record whether MOD or REM # # is requested. # # # # Step 2. Set L := expo(X)-expo(Y), k := 0, Q := 0. # # If (L < 0) then # # R := X, go to Step 4. # # else # # R := 2^(-L)X, j := L. # # endif # # # # Step 3. Perform MOD(X,Y) # # 3.1 If R = Y, go to Step 9. # # 3.2 If R > Y, then { R := R - Y, Q := Q + 1} # # 3.3 If j = 0, go to Step 4. # # 3.4 k := k + 1, j := j - 1, Q := 2Q, R := 2R. Go to # # Step 3.1. # # # # Step 4. At this point, R = X - QY = MOD(X,Y). Set # # Last_Subtract := false (used in Step 7 below). If # # MOD is requested, go to Step 6. # # # # Step 5. R = MOD(X,Y), but REM(X,Y) is requested. # # 5.1 If R < Y/2, then R = MOD(X,Y) = REM(X,Y). Go to # # Step 6. # # 5.2 If R > Y/2, then { set Last_Subtract := true, # # Q := Q + 1, Y := signY*Y }. Go to Step 6. # # 5.3 This is the tricky case of R = Y/2. If Q is odd, # # then { Q := Q + 1, signX := -signX }. # # # # Step 6. R := signX*R. # # # # Step 7. If Last_Subtract = true, R := R - Y. # # # # Step 8. Return signQ, last 7 bits of Q, and R as required. # # # # Step 9. At this point, R = 2^(-j)*X - Q Y = Y. Thus, # # X = 2^(j)*(Q+1)Y. set Q := 2^(j)*(Q+1), # # R := 0. Return signQ, last 7 bits of Q, and R. # # # ######################################################################### set Mod_Flag,L_SCR3 set Sc_Flag,L_SCR3+1 set SignY,L_SCR2 set SignX,L_SCR2+2 set SignQ,L_SCR3+2 set Y,FP_SCR0 set Y_Hi,Y+4 set Y_Lo,Y+8 set R,FP_SCR1 set R_Hi,R+4 set R_Lo,R+8 Scale: long 0x00010000,0x80000000,0x00000000,0x00000000 global smod smod: clr.b FPSR_QBYTE(%a6) mov.l %d0,-(%sp) # save ctrl bits clr.b Mod_Flag(%a6) bra.b Mod_Rem global srem srem: clr.b FPSR_QBYTE(%a6) mov.l %d0,-(%sp) # save ctrl bits mov.b &0x1,Mod_Flag(%a6) Mod_Rem: #..Save sign of X and Y movm.l &0x3f00,-(%sp) # save data registers mov.w SRC_EX(%a0),%d3 mov.w %d3,SignY(%a6) and.l &0x00007FFF,%d3 # Y := |Y| # mov.l SRC_HI(%a0),%d4 mov.l SRC_LO(%a0),%d5 # (D3,D4,D5) is |Y| tst.l %d3 bne.b Y_Normal mov.l &0x00003FFE,%d3 # $3FFD + 1 tst.l %d4 bne.b HiY_not0 HiY_0: mov.l %d5,%d4 clr.l %d5 sub.l &32,%d3 clr.l %d6 bfffo %d4{&0:&32},%d6 lsl.l %d6,%d4 sub.l %d6,%d3 # (D3,D4,D5) is normalized # ...with bias $7FFD bra.b Chk_X HiY_not0: clr.l %d6 bfffo %d4{&0:&32},%d6 sub.l %d6,%d3 lsl.l %d6,%d4 mov.l %d5,%d7 # a copy of D5 lsl.l %d6,%d5 neg.l %d6 add.l &32,%d6 lsr.l %d6,%d7 or.l %d7,%d4 # (D3,D4,D5) normalized # ...with bias $7FFD bra.b Chk_X Y_Normal: add.l &0x00003FFE,%d3 # (D3,D4,D5) normalized # ...with bias $7FFD Chk_X: mov.w DST_EX(%a1),%d0 mov.w %d0,SignX(%a6) mov.w SignY(%a6),%d1 eor.l %d0,%d1 and.l &0x00008000,%d1 mov.w %d1,SignQ(%a6) # sign(Q) obtained and.l &0x00007FFF,%d0 mov.l DST_HI(%a1),%d1 mov.l DST_LO(%a1),%d2 # (D0,D1,D2) is |X| tst.l %d0 bne.b X_Normal mov.l &0x00003FFE,%d0 tst.l %d1 bne.b HiX_not0 HiX_0: mov.l %d2,%d1 clr.l %d2 sub.l &32,%d0 clr.l %d6 bfffo %d1{&0:&32},%d6 lsl.l %d6,%d1 sub.l %d6,%d0 # (D0,D1,D2) is normalized # ...with bias $7FFD bra.b Init HiX_not0: clr.l %d6 bfffo %d1{&0:&32},%d6 sub.l %d6,%d0 lsl.l %d6,%d1 mov.l %d2,%d7 # a copy of D2 lsl.l %d6,%d2 neg.l %d6 add.l &32,%d6 lsr.l %d6,%d7 or.l %d7,%d1 # (D0,D1,D2) normalized # ...with bias $7FFD bra.b Init X_Normal: add.l &0x00003FFE,%d0 # (D0,D1,D2) normalized # ...with bias $7FFD Init: # mov.l %d3,L_SCR1(%a6) # save biased exp(Y) mov.l %d0,-(%sp) # save biased exp(X) sub.l %d3,%d0 # L := expo(X)-expo(Y) clr.l %d6 # D6 := carry <- 0 clr.l %d3 # D3 is Q mov.l &0,%a1 # A1 is k; j+k=L, Q=0 #..(Carry,D1,D2) is R tst.l %d0 bge.b Mod_Loop_pre #..expo(X) < expo(Y). Thus X = mod(X,Y) # mov.l (%sp)+,%d0 # restore d0 bra.w Get_Mod Mod_Loop_pre: addq.l &0x4,%sp # erase exp(X) #..At this point R = 2^(-L)X; Q = 0; k = 0; and k+j = L Mod_Loop: tst.l %d6 # test carry bit bgt.b R_GT_Y #..At this point carry = 0, R = (D1,D2), Y = (D4,D5) cmp.l %d1,%d4 # compare hi(R) and hi(Y) bne.b R_NE_Y cmp.l %d2,%d5 # compare lo(R) and lo(Y) bne.b R_NE_Y #..At this point, R = Y bra.w Rem_is_0 R_NE_Y: #..use the borrow of the previous compare bcs.b R_LT_Y # borrow is set iff R < Y R_GT_Y: #..If Carry is set, then Y < (Carry,D1,D2) < 2Y. Otherwise, Carry = 0 #..and Y < (D1,D2) < 2Y. Either way, perform R - Y sub.l %d5,%d2 # lo(R) - lo(Y) subx.l %d4,%d1 # hi(R) - hi(Y) clr.l %d6 # clear carry addq.l &1,%d3 # Q := Q + 1 R_LT_Y: #..At this point, Carry=0, R < Y. R = 2^(k-L)X - QY; k+j = L; j >= 0. tst.l %d0 # see if j = 0. beq.b PostLoop add.l %d3,%d3 # Q := 2Q add.l %d2,%d2 # lo(R) = 2lo(R) roxl.l &1,%d1 # hi(R) = 2hi(R) + carry scs %d6 # set Carry if 2(R) overflows addq.l &1,%a1 # k := k+1 subq.l &1,%d0 # j := j - 1 #..At this point, R=(Carry,D1,D2) = 2^(k-L)X - QY, j+k=L, j >= 0, R < 2Y. bra.b Mod_Loop PostLoop: #..k = L, j = 0, Carry = 0, R = (D1,D2) = X - QY, R < Y. #..normalize R. mov.l L_SCR1(%a6),%d0 # new biased expo of R tst.l %d1 bne.b HiR_not0 HiR_0: mov.l %d2,%d1 clr.l %d2 sub.l &32,%d0 clr.l %d6 bfffo %d1{&0:&32},%d6 lsl.l %d6,%d1 sub.l %d6,%d0 # (D0,D1,D2) is normalized # ...with bias $7FFD bra.b Get_Mod HiR_not0: clr.l %d6 bfffo %d1{&0:&32},%d6 bmi.b Get_Mod # already normalized sub.l %d6,%d0 lsl.l %d6,%d1 mov.l %d2,%d7 # a copy of D2 lsl.l %d6,%d2 neg.l %d6 add.l &32,%d6 lsr.l %d6,%d7 or.l %d7,%d1 # (D0,D1,D2) normalized # Get_Mod: cmp.l %d0,&0x000041FE bge.b No_Scale Do_Scale: mov.w %d0,R(%a6) mov.l %d1,R_Hi(%a6) mov.l %d2,R_Lo(%a6) mov.l L_SCR1(%a6),%d6 mov.w %d6,Y(%a6) mov.l %d4,Y_Hi(%a6) mov.l %d5,Y_Lo(%a6) fmov.x R(%a6),%fp0 # no exception mov.b &1,Sc_Flag(%a6) bra.b ModOrRem No_Scale: mov.l %d1,R_Hi(%a6) mov.l %d2,R_Lo(%a6) sub.l &0x3FFE,%d0 mov.w %d0,R(%a6) mov.l L_SCR1(%a6),%d6 sub.l &0x3FFE,%d6 mov.l %d6,L_SCR1(%a6) fmov.x R(%a6),%fp0 mov.w %d6,Y(%a6) mov.l %d4,Y_Hi(%a6) mov.l %d5,Y_Lo(%a6) clr.b Sc_Flag(%a6) # ModOrRem: tst.b Mod_Flag(%a6) beq.b Fix_Sign mov.l L_SCR1(%a6),%d6 # new biased expo(Y) subq.l &1,%d6 # biased expo(Y/2) cmp.l %d0,%d6 blt.b Fix_Sign bgt.b Last_Sub cmp.l %d1,%d4 bne.b Not_EQ cmp.l %d2,%d5 bne.b Not_EQ bra.w Tie_Case Not_EQ: bcs.b Fix_Sign Last_Sub: # fsub.x Y(%a6),%fp0 # no exceptions addq.l &1,%d3 # Q := Q + 1 # Fix_Sign: #..Get sign of X mov.w SignX(%a6),%d6 bge.b Get_Q fneg.x %fp0 #..Get Q # Get_Q: clr.l %d6 mov.w SignQ(%a6),%d6 # D6 is sign(Q) mov.l &8,%d7 lsr.l %d7,%d6 and.l &0x0000007F,%d3 # 7 bits of Q or.l %d6,%d3 # sign and bits of Q # swap %d3 # fmov.l %fpsr,%d6 # and.l &0xFF00FFFF,%d6 # or.l %d3,%d6 # fmov.l %d6,%fpsr # put Q in fpsr mov.b %d3,FPSR_QBYTE(%a6) # put Q in fpsr # Restore: movm.l (%sp)+,&0xfc # {%d2-%d7} mov.l (%sp)+,%d0 fmov.l %d0,%fpcr tst.b Sc_Flag(%a6) beq.b Finish mov.b &FMUL_OP,%d1 # last inst is MUL fmul.x Scale(%pc),%fp0 # may cause underflow bra t_catch2 # the '040 package did this apparently to see if the dst operand for the # preceding fmul was a denorm. but, it better not have been since the # algorithm just got done playing with fp0 and expected no exceptions # as a result. trust me... # bra t_avoid_unsupp # check for denorm as a # ;result of the scaling Finish: mov.b &FMOV_OP,%d1 # last inst is MOVE fmov.x %fp0,%fp0 # capture exceptions & round bra t_catch2 Rem_is_0: #..R = 2^(-j)X - Q Y = Y, thus R = 0 and quotient = 2^j (Q+1) addq.l &1,%d3 cmp.l %d0,&8 # D0 is j bge.b Q_Big lsl.l %d0,%d3 bra.b Set_R_0 Q_Big: clr.l %d3 Set_R_0: fmov.s &0x00000000,%fp0 clr.b Sc_Flag(%a6) bra.w Fix_Sign Tie_Case: #..Check parity of Q mov.l %d3,%d6 and.l &0x00000001,%d6 tst.l %d6 beq.w Fix_Sign # Q is even #..Q is odd, Q := Q + 1, signX := -signX addq.l &1,%d3 mov.w SignX(%a6),%d6 eor.l &0x00008000,%d6 mov.w %d6,SignX(%a6) bra.w Fix_Sign ######################################################################### # XDEF **************************************************************** # # tag(): return the optype of the input ext fp number # # # # This routine is used by the 060FPLSP. # # # # XREF **************************************************************** # # None # # # # INPUT *************************************************************** # # a0 = pointer to extended precision operand # # # # OUTPUT ************************************************************** # # d0 = value of type tag # # one of: NORM, INF, QNAN, SNAN, DENORM, ZERO # # # # ALGORITHM *********************************************************** # # Simply test the exponent, j-bit, and mantissa values to # # determine the type of operand. # # If it's an unnormalized zero, alter the operand and force it # # to be a normal zero. # # # ######################################################################### global tag tag: mov.w FTEMP_EX(%a0), %d0 # extract exponent andi.w &0x7fff, %d0 # strip off sign cmpi.w %d0, &0x7fff # is (EXP == MAX)? beq.b inf_or_nan_x not_inf_or_nan_x: btst &0x7,FTEMP_HI(%a0) beq.b not_norm_x is_norm_x: mov.b &NORM, %d0 rts not_norm_x: tst.w %d0 # is exponent = 0? bne.b is_unnorm_x not_unnorm_x: tst.l FTEMP_HI(%a0) bne.b is_denorm_x tst.l FTEMP_LO(%a0) bne.b is_denorm_x is_zero_x: mov.b &ZERO, %d0 rts is_denorm_x: mov.b &DENORM, %d0 rts is_unnorm_x: bsr.l unnorm_fix # convert to norm,denorm,or zero rts is_unnorm_reg_x: mov.b &UNNORM, %d0 rts inf_or_nan_x: tst.l FTEMP_LO(%a0) bne.b is_nan_x mov.l FTEMP_HI(%a0), %d0 and.l &0x7fffffff, %d0 # msb is a don't care! bne.b is_nan_x is_inf_x: mov.b &INF, %d0 rts is_nan_x: mov.b &QNAN, %d0 rts ############################################################# qnan: long 0x7fff0000, 0xffffffff, 0xffffffff ######################################################################### # XDEF **************************************************************** # # t_dz(): Handle 060FPLSP dz exception for "flogn" emulation. # # t_dz2(): Handle 060FPLSP dz exception for "fatanh" emulation. # # # # These rouitnes are used by the 060FPLSP package. # # # # XREF **************************************************************** # # None # # # # INPUT *************************************************************** # # a0 = pointer to extended precision source operand. # # # # OUTPUT ************************************************************** # # fp0 = default DZ result. # # # # ALGORITHM *********************************************************** # # Transcendental emulation for the 060FPLSP has detected that # # a DZ exception should occur for the instruction. If DZ is disabled, # # return the default result. # # If DZ is enabled, the dst operand should be returned unscathed # # in fp0 while fp1 is used to create a DZ exception so that the # # operating system can log that such an event occurred. # # # ######################################################################### global t_dz t_dz: tst.b SRC_EX(%a0) # check sign for neg or pos bpl.b dz_pinf # branch if pos sign global t_dz2 t_dz2: ori.l &dzinf_mask+neg_mask,USER_FPSR(%a6) # set N/I/DZ/ADZ btst &dz_bit,FPCR_ENABLE(%a6) bne.b dz_minf_ena # dz is disabled. return a -INF. fmov.s &0xff800000,%fp0 # return -INF rts # dz is enabled. create a dz exception so the user can record it # but use fp1 instead. return the dst operand unscathed in fp0. dz_minf_ena: fmovm.x EXC_FP0(%a6),&0x80 # return fp0 unscathed fmov.l USER_FPCR(%a6),%fpcr fmov.s &0xbf800000,%fp1 # load -1 fdiv.s &0x00000000,%fp1 # -1 / 0 rts dz_pinf: ori.l &dzinf_mask,USER_FPSR(%a6) # set I/DZ/ADZ btst &dz_bit,FPCR_ENABLE(%a6) bne.b dz_pinf_ena # dz is disabled. return a +INF. fmov.s &0x7f800000,%fp0 # return +INF rts # dz is enabled. create a dz exception so the user can record it # but use fp1 instead. return the dst operand unscathed in fp0. dz_pinf_ena: fmovm.x EXC_FP0(%a6),&0x80 # return fp0 unscathed fmov.l USER_FPCR(%a6),%fpcr fmov.s &0x3f800000,%fp1 # load +1 fdiv.s &0x00000000,%fp1 # +1 / 0 rts ######################################################################### # XDEF **************************************************************** # # t_operr(): Handle 060FPLSP OPERR exception during emulation. # # # # This routine is used by the 060FPLSP package. # # # # XREF **************************************************************** # # None. # # # # INPUT *************************************************************** # # fp1 = source operand # # # # OUTPUT ************************************************************** # # fp0 = default result # # fp1 = unchanged # # # # ALGORITHM *********************************************************** # # An operand error should occur as the result of transcendental # # emulation in the 060FPLSP. If OPERR is disabled, just return a NAN # # in fp0. If OPERR is enabled, return the dst operand unscathed in fp0 # # and the source operand in fp1. Use fp2 to create an OPERR exception # # so that the operating system can log the event. # # # ######################################################################### global t_operr t_operr: ori.l &opnan_mask,USER_FPSR(%a6) # set NAN/OPERR/AIOP btst &operr_bit,FPCR_ENABLE(%a6) bne.b operr_ena # operr is disabled. return a QNAN in fp0 fmovm.x qnan(%pc),&0x80 # return QNAN rts # operr is enabled. create an operr exception so the user can record it # but use fp2 instead. return the dst operand unscathed in fp0. operr_ena: fmovm.x EXC_FP0(%a6),&0x80 # return fp0 unscathed fmov.l USER_FPCR(%a6),%fpcr fmovm.x &0x04,-(%sp) # save fp2 fmov.s &0x7f800000,%fp2 # load +INF fmul.s &0x00000000,%fp2 # +INF x 0 fmovm.x (%sp)+,&0x20 # restore fp2 rts pls_huge: long 0x7ffe0000,0xffffffff,0xffffffff mns_huge: long 0xfffe0000,0xffffffff,0xffffffff pls_tiny: long 0x00000000,0x80000000,0x00000000 mns_tiny: long 0x80000000,0x80000000,0x00000000 ######################################################################### # XDEF **************************************************************** # # t_unfl(): Handle 060FPLSP underflow exception during emulation. # # t_unfl2(): Handle 060FPLSP underflow exception during # # emulation. result always positive. # # # # This routine is used by the 060FPLSP package. # # # # XREF **************************************************************** # # None. # # # # INPUT *************************************************************** # # a0 = pointer to extended precision source operand # # # # OUTPUT ************************************************************** # # fp0 = default underflow result # # # # ALGORITHM *********************************************************** # # An underflow should occur as the result of transcendental # # emulation in the 060FPLSP. Create an underflow by using "fmul" # # and two very small numbers of appropriate sign so the the operating # # system can log the event. # # # ######################################################################### global t_unfl t_unfl: tst.b SRC_EX(%a0) bpl.b unf_pos global t_unfl2 t_unfl2: ori.l &unfinx_mask+neg_mask,USER_FPSR(%a6) # set N/UNFL/INEX2/AUNFL/AINEX fmov.l USER_FPCR(%a6),%fpcr fmovm.x mns_tiny(%pc),&0x80 fmul.x pls_tiny(%pc),%fp0 fmov.l %fpsr,%d0 rol.l &0x8,%d0 mov.b %d0,FPSR_CC(%a6) rts unf_pos: ori.w &unfinx_mask,FPSR_EXCEPT(%a6) # set UNFL/INEX2/AUNFL/AINEX fmov.l USER_FPCR(%a6),%fpcr fmovm.x pls_tiny(%pc),&0x80 fmul.x %fp0,%fp0 fmov.l %fpsr,%d0 rol.l &0x8,%d0 mov.b %d0,FPSR_CC(%a6) rts ######################################################################### # XDEF **************************************************************** # # t_ovfl(): Handle 060FPLSP overflow exception during emulation. # # (monadic) # # t_ovfl2(): Handle 060FPLSP overflow exception during # # emulation. result always positive. (dyadic) # # t_ovfl_sc(): Handle 060FPLSP overflow exception during # # emulation for "fscale". # # # # This routine is used by the 060FPLSP package. # # # # XREF **************************************************************** # # None. # # # # INPUT *************************************************************** # # a0 = pointer to extended precision source operand # # # # OUTPUT ************************************************************** # # fp0 = default underflow result # # # # ALGORITHM *********************************************************** # # An overflow should occur as the result of transcendental # # emulation in the 060FPLSP. Create an overflow by using "fmul" # # and two very lareg numbers of appropriate sign so the the operating # # system can log the event. # # For t_ovfl_sc() we take special care not to lose the INEX2 bit. # # # ######################################################################### global t_ovfl_sc t_ovfl_sc: ori.l &ovfl_inx_mask,USER_FPSR(%a6) # set OVFL/AOVFL/AINEX mov.b %d0,%d1 # fetch rnd prec,mode andi.b &0xc0,%d1 # extract prec beq.w ovfl_work # dst op is a DENORM. we have to normalize the mantissa to see if the # result would be inexact for the given precision. make a copy of the # dst so we don't screw up the version passed to us. mov.w LOCAL_EX(%a0),FP_SCR0_EX(%a6) mov.l LOCAL_HI(%a0),FP_SCR0_HI(%a6) mov.l LOCAL_LO(%a0),FP_SCR0_LO(%a6) lea FP_SCR0(%a6),%a0 # pass ptr to FP_SCR0 movm.l &0xc080,-(%sp) # save d0-d1/a0 bsr.l norm # normalize mantissa movm.l (%sp)+,&0x0103 # restore d0-d1/a0 cmpi.b %d1,&0x40 # is precision sgl? bne.b ovfl_sc_dbl # no; dbl ovfl_sc_sgl: tst.l LOCAL_LO(%a0) # is lo lw of sgl set? bne.b ovfl_sc_inx # yes tst.b 3+LOCAL_HI(%a0) # is lo byte of hi lw set? bne.b ovfl_sc_inx # yes bra.w ovfl_work # don't set INEX2 ovfl_sc_dbl: mov.l LOCAL_LO(%a0),%d1 # are any of lo 11 bits of andi.l &0x7ff,%d1 # dbl mantissa set? beq.w ovfl_work # no; don't set INEX2 ovfl_sc_inx: ori.l &inex2_mask,USER_FPSR(%a6) # set INEX2 bra.b ovfl_work # continue global t_ovfl t_ovfl: ori.w &ovfinx_mask,FPSR_EXCEPT(%a6) # set OVFL/INEX2/AOVFL/AINEX ovfl_work: tst.b SRC_EX(%a0) bpl.b ovfl_p ovfl_m: fmov.l USER_FPCR(%a6),%fpcr fmovm.x mns_huge(%pc),&0x80 fmul.x pls_huge(%pc),%fp0 fmov.l %fpsr,%d0 rol.l &0x8,%d0 ori.b &neg_mask,%d0 mov.b %d0,FPSR_CC(%a6) rts ovfl_p: fmov.l USER_FPCR(%a6),%fpcr fmovm.x pls_huge(%pc),&0x80 fmul.x pls_huge(%pc),%fp0 fmov.l %fpsr,%d0 rol.l &0x8,%d0 mov.b %d0,FPSR_CC(%a6) rts global t_ovfl2 t_ovfl2: ori.w &ovfinx_mask,FPSR_EXCEPT(%a6) # set OVFL/INEX2/AOVFL/AINEX fmov.l USER_FPCR(%a6),%fpcr fmovm.x pls_huge(%pc),&0x80 fmul.x pls_huge(%pc),%fp0 fmov.l %fpsr,%d0 rol.l &0x8,%d0 mov.b %d0,FPSR_CC(%a6) rts ######################################################################### # XDEF **************************************************************** # # t_catch(): Handle 060FPLSP OVFL,UNFL,or INEX2 exception during # # emulation. # # t_catch2(): Handle 060FPLSP OVFL,UNFL,or INEX2 exception during # # emulation. # # # # These routines are used by the 060FPLSP package. # # # # XREF **************************************************************** # # None. # # # # INPUT *************************************************************** # # fp0 = default underflow or overflow result # # # # OUTPUT ************************************************************** # # fp0 = default result # # # # ALGORITHM *********************************************************** # # If an overflow or underflow occurred during the last # # instruction of transcendental 060FPLSP emulation, then it has already # # occurred and has been logged. Now we need to see if an inexact # # exception should occur. # # # ######################################################################### global t_catch2 t_catch2: fmov.l %fpsr,%d0 or.l %d0,USER_FPSR(%a6) bra.b inx2_work global t_catch t_catch: fmov.l %fpsr,%d0 or.l %d0,USER_FPSR(%a6) ######################################################################### # XDEF **************************************************************** # # t_inx2(): Handle inexact 060FPLSP exception during emulation. # # t_pinx2(): Handle inexact 060FPLSP exception for "+" results. # # t_minx2(): Handle inexact 060FPLSP exception for "-" results. # # # # XREF **************************************************************** # # None. # # # # INPUT *************************************************************** # # fp0 = default result # # # # OUTPUT ************************************************************** # # fp0 = default result # # # # ALGORITHM *********************************************************** # # The last instruction of transcendental emulation for the # # 060FPLSP should be inexact. So, if inexact is enabled, then we create # # the event here by adding a large and very small number together # # so that the operating system can log the event. # # Must check, too, if the result was zero, in which case we just # # set the FPSR bits and return. # # # ######################################################################### global t_inx2 t_inx2: fblt.w t_minx2 fbeq.w inx2_zero global t_pinx2 t_pinx2: ori.w &inx2a_mask,FPSR_EXCEPT(%a6) # set INEX2/AINEX bra.b inx2_work global t_minx2 t_minx2: ori.l &inx2a_mask+neg_mask,USER_FPSR(%a6) inx2_work: btst &inex2_bit,FPCR_ENABLE(%a6) # is inexact enabled? bne.b inx2_work_ena # yes rts inx2_work_ena: fmov.l USER_FPCR(%a6),%fpcr # insert user's exceptions fmov.s &0x3f800000,%fp1 # load +1 fadd.x pls_tiny(%pc),%fp1 # cause exception rts inx2_zero: mov.b &z_bmask,FPSR_CC(%a6) ori.w &inx2a_mask,2+USER_FPSR(%a6) # set INEX/AINEX rts ######################################################################### # XDEF **************************************************************** # # t_extdnrm(): Handle DENORM inputs in 060FPLSP. # # t_resdnrm(): Handle DENORM inputs in 060FPLSP for "fscale". # # # # This routine is used by the 060FPLSP package. # # # # XREF **************************************************************** # # None. # # # # INPUT *************************************************************** # # a0 = pointer to extended precision input operand # # # # OUTPUT ************************************************************** # # fp0 = default result # # # # ALGORITHM *********************************************************** # # For all functions that have a denormalized input and that # # f(x)=x, this is the entry point. # # DENORM value is moved using "fmove" which triggers an exception # # if enabled so the operating system can log the event. # # # ######################################################################### global t_extdnrm t_extdnrm: fmov.l USER_FPCR(%a6),%fpcr fmov.x SRC_EX(%a0),%fp0 fmov.l %fpsr,%d0 ori.l &unfinx_mask,%d0 or.l %d0,USER_FPSR(%a6) rts global t_resdnrm t_resdnrm: fmov.l USER_FPCR(%a6),%fpcr fmov.x SRC_EX(%a0),%fp0 fmov.l %fpsr,%d0 or.l %d0,USER_FPSR(%a6) rts ########################################## # # sto_cos: # This is used by fsincos library emulation. The correct # values are already in fp0 and fp1 so we do nothing here. # global sto_cos sto_cos: rts ########################################## # # dst_qnan --- force result when destination is a NaN # global dst_qnan dst_qnan: fmov.x DST(%a1),%fp0 tst.b DST_EX(%a1) bmi.b dst_qnan_m dst_qnan_p: mov.b &nan_bmask,FPSR_CC(%a6) rts dst_qnan_m: mov.b &nan_bmask+neg_bmask,FPSR_CC(%a6) rts # # src_qnan --- force result when source is a NaN # global src_qnan src_qnan: fmov.x SRC(%a0),%fp0 tst.b SRC_EX(%a0) bmi.b src_qnan_m src_qnan_p: mov.b &nan_bmask,FPSR_CC(%a6) rts src_qnan_m: mov.b &nan_bmask+neg_bmask,FPSR_CC(%a6) rts ########################################## # # Native instruction support # # Some systems may need entry points even for 68060 native # instructions. These routines are provided for # convenience. # global _fadds_ _fadds_: fmov.l %fpcr,-(%sp) # save fpcr fmov.l &0x00000000,%fpcr # clear fpcr for load fmov.s 0x8(%sp),%fp0 # load sgl dst fmov.l (%sp)+,%fpcr # restore fpcr fadd.s 0x8(%sp),%fp0 # fadd w/ sgl src rts global _faddd_ _faddd_: fmov.l %fpcr,-(%sp) # save fpcr fmov.l &0x00000000,%fpcr # clear fpcr for load fmov.d 0x8(%sp),%fp0 # load dbl dst fmov.l (%sp)+,%fpcr # restore fpcr fadd.d 0xc(%sp),%fp0 # fadd w/ dbl src rts global _faddx_ _faddx_: fmovm.x 0x4(%sp),&0x80 # load ext dst fadd.x 0x10(%sp),%fp0 # fadd w/ ext src rts global _fsubs_ _fsubs_: fmov.l %fpcr,-(%sp) # save fpcr fmov.l &0x00000000,%fpcr # clear fpcr for load fmov.s 0x8(%sp),%fp0 # load sgl dst fmov.l (%sp)+,%fpcr # restore fpcr fsub.s 0x8(%sp),%fp0 # fsub w/ sgl src rts global _fsubd_ _fsubd_: fmov.l %fpcr,-(%sp) # save fpcr fmov.l &0x00000000,%fpcr # clear fpcr for load fmov.d 0x8(%sp),%fp0 # load dbl dst fmov.l (%sp)+,%fpcr # restore fpcr fsub.d 0xc(%sp),%fp0 # fsub w/ dbl src rts global _fsubx_ _fsubx_: fmovm.x 0x4(%sp),&0x80 # load ext dst fsub.x 0x10(%sp),%fp0 # fsub w/ ext src rts global _fmuls_ _fmuls_: fmov.l %fpcr,-(%sp) # save fpcr fmov.l &0x00000000,%fpcr # clear fpcr for load fmov.s 0x8(%sp),%fp0 # load sgl dst fmov.l (%sp)+,%fpcr # restore fpcr fmul.s 0x8(%sp),%fp0 # fmul w/ sgl src rts global _fmuld_ _fmuld_: fmov.l %fpcr,-(%sp) # save fpcr fmov.l &0x00000000,%fpcr # clear fpcr for load fmov.d 0x8(%sp),%fp0 # load dbl dst fmov.l (%sp)+,%fpcr # restore fpcr fmul.d 0xc(%sp),%fp0 # fmul w/ dbl src rts global _fmulx_ _fmulx_: fmovm.x 0x4(%sp),&0x80 # load ext dst fmul.x 0x10(%sp),%fp0 # fmul w/ ext src rts global _fdivs_ _fdivs_: fmov.l %fpcr,-(%sp) # save fpcr fmov.l &0x00000000,%fpcr # clear fpcr for load fmov.s 0x8(%sp),%fp0 # load sgl dst fmov.l (%sp)+,%fpcr # restore fpcr fdiv.s 0x8(%sp),%fp0 # fdiv w/ sgl src rts global _fdivd_ _fdivd_: fmov.l %fpcr,-(%sp) # save fpcr fmov.l &0x00000000,%fpcr # clear fpcr for load fmov.d 0x8(%sp),%fp0 # load dbl dst fmov.l (%sp)+,%fpcr # restore fpcr fdiv.d 0xc(%sp),%fp0 # fdiv w/ dbl src rts global _fdivx_ _fdivx_: fmovm.x 0x4(%sp),&0x80 # load ext dst fdiv.x 0x10(%sp),%fp0 # fdiv w/ ext src rts global _fabss_ _fabss_: fabs.s 0x4(%sp),%fp0 # fabs w/ sgl src rts global _fabsd_ _fabsd_: fabs.d 0x4(%sp),%fp0 # fabs w/ dbl src rts global _fabsx_ _fabsx_: fabs.x 0x4(%sp),%fp0 # fabs w/ ext src rts global _fnegs_ _fnegs_: fneg.s 0x4(%sp),%fp0 # fneg w/ sgl src rts global _fnegd_ _fnegd_: fneg.d 0x4(%sp),%fp0 # fneg w/ dbl src rts global _fnegx_ _fnegx_: fneg.x 0x4(%sp),%fp0 # fneg w/ ext src rts global _fsqrts_ _fsqrts_: fsqrt.s 0x4(%sp),%fp0 # fsqrt w/ sgl src rts global _fsqrtd_ _fsqrtd_: fsqrt.d 0x4(%sp),%fp0 # fsqrt w/ dbl src rts global _fsqrtx_ _fsqrtx_: fsqrt.x 0x4(%sp),%fp0 # fsqrt w/ ext src rts global _fints_ _fints_: fint.s 0x4(%sp),%fp0 # fint w/ sgl src rts global _fintd_ _fintd_: fint.d 0x4(%sp),%fp0 # fint w/ dbl src rts global _fintx_ _fintx_: fint.x 0x4(%sp),%fp0 # fint w/ ext src rts global _fintrzs_ _fintrzs_: fintrz.s 0x4(%sp),%fp0 # fintrz w/ sgl src rts global _fintrzd_ _fintrzd_: fintrz.d 0x4(%sp),%fp0 # fintrx w/ dbl src rts global _fintrzx_ _fintrzx_: fintrz.x 0x4(%sp),%fp0 # fintrz w/ ext src rts ######################################################################## ######################################################################### # src_zero(): Return signed zero according to sign of src operand. # ######################################################################### global src_zero src_zero: tst.b SRC_EX(%a0) # get sign of src operand bmi.b ld_mzero # if neg, load neg zero # # ld_pzero(): return a positive zero. # global ld_pzero ld_pzero: fmov.s &0x00000000,%fp0 # load +0 mov.b &z_bmask,FPSR_CC(%a6) # set 'Z' ccode bit rts # ld_mzero(): return a negative zero. global ld_mzero ld_mzero: fmov.s &0x80000000,%fp0 # load -0 mov.b &neg_bmask+z_bmask,FPSR_CC(%a6) # set 'N','Z' ccode bits rts ######################################################################### # dst_zero(): Return signed zero according to sign of dst operand. # ######################################################################### global dst_zero dst_zero: tst.b DST_EX(%a1) # get sign of dst operand bmi.b ld_mzero # if neg, load neg zero bra.b ld_pzero # load positive zero ######################################################################### # src_inf(): Return signed inf according to sign of src operand. # ######################################################################### global src_inf src_inf: tst.b SRC_EX(%a0) # get sign of src operand bmi.b ld_minf # if negative branch # # ld_pinf(): return a positive infinity. # global ld_pinf ld_pinf: fmov.s &0x7f800000,%fp0 # load +INF mov.b &inf_bmask,FPSR_CC(%a6) # set 'INF' ccode bit rts # # ld_minf():return a negative infinity. # global ld_minf ld_minf: fmov.s &0xff800000,%fp0 # load -INF mov.b &neg_bmask+inf_bmask,FPSR_CC(%a6) # set 'N','I' ccode bits rts ######################################################################### # dst_inf(): Return signed inf according to sign of dst operand. # ######################################################################### global dst_inf dst_inf: tst.b DST_EX(%a1) # get sign of dst operand bmi.b ld_minf # if negative branch bra.b ld_pinf global szr_inf ################################################################# # szr_inf(): Return +ZERO for a negative src operand or # # +INF for a positive src operand. # # Routine used for fetox, ftwotox, and ftentox. # ################################################################# szr_inf: tst.b SRC_EX(%a0) # check sign of source bmi.b ld_pzero bra.b ld_pinf ######################################################################### # sopr_inf(): Return +INF for a positive src operand or # # jump to operand error routine for a negative src operand. # # Routine used for flogn, flognp1, flog10, and flog2. # ######################################################################### global sopr_inf sopr_inf: tst.b SRC_EX(%a0) # check sign of source bmi.w t_operr bra.b ld_pinf ################################################################# # setoxm1i(): Return minus one for a negative src operand or # # positive infinity for a positive src operand. # # Routine used for fetoxm1. # ################################################################# global setoxm1i setoxm1i: tst.b SRC_EX(%a0) # check sign of source bmi.b ld_mone bra.b ld_pinf ######################################################################### # src_one(): Return signed one according to sign of src operand. # ######################################################################### global src_one src_one: tst.b SRC_EX(%a0) # check sign of source bmi.b ld_mone # # ld_pone(): return positive one. # global ld_pone ld_pone: fmov.s &0x3f800000,%fp0 # load +1 clr.b FPSR_CC(%a6) rts # # ld_mone(): return negative one. # global ld_mone ld_mone: fmov.s &0xbf800000,%fp0 # load -1 mov.b &neg_bmask,FPSR_CC(%a6) # set 'N' ccode bit rts ppiby2: long 0x3fff0000, 0xc90fdaa2, 0x2168c235 mpiby2: long 0xbfff0000, 0xc90fdaa2, 0x2168c235 ################################################################# # spi_2(): Return signed PI/2 according to sign of src operand. # ################################################################# global spi_2 spi_2: tst.b SRC_EX(%a0) # check sign of source bmi.b ld_mpi2 # # ld_ppi2(): return positive PI/2. # global ld_ppi2 ld_ppi2: fmov.l %d0,%fpcr fmov.x ppiby2(%pc),%fp0 # load +pi/2 bra.w t_pinx2 # set INEX2 # # ld_mpi2(): return negative PI/2. # global ld_mpi2 ld_mpi2: fmov.l %d0,%fpcr fmov.x mpiby2(%pc),%fp0 # load -pi/2 bra.w t_minx2 # set INEX2 #################################################### # The following routines give support for fsincos. # #################################################### # # ssincosz(): When the src operand is ZERO, store a one in the # cosine register and return a ZERO in fp0 w/ the same sign # as the src operand. # global ssincosz ssincosz: fmov.s &0x3f800000,%fp1 tst.b SRC_EX(%a0) # test sign bpl.b sincoszp fmov.s &0x80000000,%fp0 # return sin result in fp0 mov.b &z_bmask+neg_bmask,FPSR_CC(%a6) rts sincoszp: fmov.s &0x00000000,%fp0 # return sin result in fp0 mov.b &z_bmask,FPSR_CC(%a6) rts # # ssincosi(): When the src operand is INF, store a QNAN in the cosine # register and jump to the operand error routine for negative # src operands. # global ssincosi ssincosi: fmov.x qnan(%pc),%fp1 # load NAN bra.w t_operr # # ssincosqnan(): When the src operand is a QNAN, store the QNAN in the cosine # register and branch to the src QNAN routine. # global ssincosqnan ssincosqnan: fmov.x LOCAL_EX(%a0),%fp1 bra.w src_qnan ######################################################################## global smod_sdnrm global smod_snorm smod_sdnrm: smod_snorm: mov.b DTAG(%a6),%d1 beq.l smod cmpi.b %d1,&ZERO beq.w smod_zro cmpi.b %d1,&INF beq.l t_operr cmpi.b %d1,&DENORM beq.l smod bra.l dst_qnan global smod_szero smod_szero: mov.b DTAG(%a6),%d1 beq.l t_operr cmpi.b %d1,&ZERO beq.l t_operr cmpi.b %d1,&INF beq.l t_operr cmpi.b %d1,&DENORM beq.l t_operr bra.l dst_qnan global smod_sinf smod_sinf: mov.b DTAG(%a6),%d1 beq.l smod_fpn cmpi.b %d1,&ZERO beq.l smod_zro cmpi.b %d1,&INF beq.l t_operr cmpi.b %d1,&DENORM beq.l smod_fpn bra.l dst_qnan smod_zro: srem_zro: mov.b SRC_EX(%a0),%d1 # get src sign mov.b DST_EX(%a1),%d0 # get dst sign eor.b %d0,%d1 # get qbyte sign andi.b &0x80,%d1 mov.b %d1,FPSR_QBYTE(%a6) tst.b %d0 bpl.w ld_pzero bra.w ld_mzero smod_fpn: srem_fpn: clr.b FPSR_QBYTE(%a6) mov.l %d0,-(%sp) mov.b SRC_EX(%a0),%d1 # get src sign mov.b DST_EX(%a1),%d0 # get dst sign eor.b %d0,%d1 # get qbyte sign andi.b &0x80,%d1 mov.b %d1,FPSR_QBYTE(%a6) cmpi.b DTAG(%a6),&DENORM bne.b smod_nrm lea DST(%a1),%a0 mov.l (%sp)+,%d0 bra t_resdnrm smod_nrm: fmov.l (%sp)+,%fpcr fmov.x DST(%a1),%fp0 tst.b DST_EX(%a1) bmi.b smod_nrm_neg rts smod_nrm_neg: mov.b &neg_bmask,FPSR_CC(%a6) # set 'N' code rts ######################################################################### global srem_snorm global srem_sdnrm srem_sdnrm: srem_snorm: mov.b DTAG(%a6),%d1 beq.l srem cmpi.b %d1,&ZERO beq.w srem_zro cmpi.b %d1,&INF beq.l t_operr cmpi.b %d1,&DENORM beq.l srem bra.l dst_qnan global srem_szero srem_szero: mov.b DTAG(%a6),%d1 beq.l t_operr cmpi.b %d1,&ZERO beq.l t_operr cmpi.b %d1,&INF beq.l t_operr cmpi.b %d1,&DENORM beq.l t_operr bra.l dst_qnan global srem_sinf srem_sinf: mov.b DTAG(%a6),%d1 beq.w srem_fpn cmpi.b %d1,&ZERO beq.w srem_zro cmpi.b %d1,&INF beq.l t_operr cmpi.b %d1,&DENORM beq.l srem_fpn bra.l dst_qnan ######################################################################### global sscale_snorm global sscale_sdnrm sscale_snorm: sscale_sdnrm: mov.b DTAG(%a6),%d1 beq.l sscale cmpi.b %d1,&ZERO beq.l dst_zero cmpi.b %d1,&INF beq.l dst_inf cmpi.b %d1,&DENORM beq.l sscale bra.l dst_qnan global sscale_szero sscale_szero: mov.b DTAG(%a6),%d1 beq.l sscale cmpi.b %d1,&ZERO beq.l dst_zero cmpi.b %d1,&INF beq.l dst_inf cmpi.b %d1,&DENORM beq.l sscale bra.l dst_qnan global sscale_sinf sscale_sinf: mov.b DTAG(%a6),%d1 beq.l t_operr cmpi.b %d1,&QNAN beq.l dst_qnan bra.l t_operr ######################################################################## global sop_sqnan sop_sqnan: mov.b DTAG(%a6),%d1 cmpi.b %d1,&QNAN beq.l dst_qnan bra.l src_qnan ######################################################################### # norm(): normalize the mantissa of an extended precision input. the # # input operand should not be normalized already. # # # # XDEF **************************************************************** # # norm() # # # # XREF **************************************************************** # # none # # # # INPUT *************************************************************** # # a0 = pointer fp extended precision operand to normalize # # # # OUTPUT ************************************************************** # # d0 = number of bit positions the mantissa was shifted # # a0 = the input operand's mantissa is normalized; the exponent # # is unchanged. # # # ######################################################################### global norm norm: mov.l %d2, -(%sp) # create some temp regs mov.l %d3, -(%sp) mov.l FTEMP_HI(%a0), %d0 # load hi(mantissa) mov.l FTEMP_LO(%a0), %d1 # load lo(mantissa) bfffo %d0{&0:&32}, %d2 # how many places to shift? beq.b norm_lo # hi(man) is all zeroes! norm_hi: lsl.l %d2, %d0 # left shift hi(man) bfextu %d1{&0:%d2}, %d3 # extract lo bits or.l %d3, %d0 # create hi(man) lsl.l %d2, %d1 # create lo(man) mov.l %d0, FTEMP_HI(%a0) # store new hi(man) mov.l %d1, FTEMP_LO(%a0) # store new lo(man) mov.l %d2, %d0 # return shift amount mov.l (%sp)+, %d3 # restore temp regs mov.l (%sp)+, %d2 rts norm_lo: bfffo %d1{&0:&32}, %d2 # how many places to shift? lsl.l %d2, %d1 # shift lo(man) add.l &32, %d2 # add 32 to shft amount mov.l %d1, FTEMP_HI(%a0) # store hi(man) clr.l FTEMP_LO(%a0) # lo(man) is now zero mov.l %d2, %d0 # return shift amount mov.l (%sp)+, %d3 # restore temp regs mov.l (%sp)+, %d2 rts ######################################################################### # unnorm_fix(): - changes an UNNORM to one of NORM, DENORM, or ZERO # # - returns corresponding optype tag # # # # XDEF **************************************************************** # # unnorm_fix() # # # # XREF **************************************************************** # # norm() - normalize the mantissa # # # # INPUT *************************************************************** # # a0 = pointer to unnormalized extended precision number # # # # OUTPUT ************************************************************** # # d0 = optype tag - is corrected to one of NORM, DENORM, or ZERO # # a0 = input operand has been converted to a norm, denorm, or # # zero; both the exponent and mantissa are changed. # # # ######################################################################### global unnorm_fix unnorm_fix: bfffo FTEMP_HI(%a0){&0:&32}, %d0 # how many shifts are needed? bne.b unnorm_shift # hi(man) is not all zeroes # # hi(man) is all zeroes so see if any bits in lo(man) are set # unnorm_chk_lo: bfffo FTEMP_LO(%a0){&0:&32}, %d0 # is operand really a zero? beq.w unnorm_zero # yes add.w &32, %d0 # no; fix shift distance # # d0 = # shifts needed for complete normalization # unnorm_shift: clr.l %d1 # clear top word mov.w FTEMP_EX(%a0), %d1 # extract exponent and.w &0x7fff, %d1 # strip off sgn cmp.w %d0, %d1 # will denorm push exp < 0? bgt.b unnorm_nrm_zero # yes; denorm only until exp = 0 # # exponent would not go < 0. therefore, number stays normalized # sub.w %d0, %d1 # shift exponent value mov.w FTEMP_EX(%a0), %d0 # load old exponent and.w &0x8000, %d0 # save old sign or.w %d0, %d1 # {sgn,new exp} mov.w %d1, FTEMP_EX(%a0) # insert new exponent bsr.l norm # normalize UNNORM mov.b &NORM, %d0 # return new optype tag rts # # exponent would go < 0, so only denormalize until exp = 0 # unnorm_nrm_zero: cmp.b %d1, &32 # is exp <= 32? bgt.b unnorm_nrm_zero_lrg # no; go handle large exponent bfextu FTEMP_HI(%a0){%d1:&32}, %d0 # extract new hi(man) mov.l %d0, FTEMP_HI(%a0) # save new hi(man) mov.l FTEMP_LO(%a0), %d0 # fetch old lo(man) lsl.l %d1, %d0 # extract new lo(man) mov.l %d0, FTEMP_LO(%a0) # save new lo(man) and.w &0x8000, FTEMP_EX(%a0) # set exp = 0 mov.b &DENORM, %d0 # return new optype tag rts # # only mantissa bits set are in lo(man) # unnorm_nrm_zero_lrg: sub.w &32, %d1 # adjust shft amt by 32 mov.l FTEMP_LO(%a0), %d0 # fetch old lo(man) lsl.l %d1, %d0 # left shift lo(man) mov.l %d0, FTEMP_HI(%a0) # store new hi(man) clr.l FTEMP_LO(%a0) # lo(man) = 0 and.w &0x8000, FTEMP_EX(%a0) # set exp = 0 mov.b &DENORM, %d0 # return new optype tag rts # # whole mantissa is zero so this UNNORM is actually a zero # unnorm_zero: and.w &0x8000, FTEMP_EX(%a0) # force exponent to zero mov.b &ZERO, %d0 # fix optype tag rts